[发明专利]一种统计互联网用户网络访问行为的方法和装置有效
申请号: | 200810225462.8 | 申请日: | 2008-10-31 |
公开(公告)号: | CN101729288A | 公开(公告)日: | 2010-06-09 |
发明(设计)人: | 毛伟;李晓东;王欣;尉迟学彪;王伟 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08;G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统计 互联网 用户 网络 访问 行为 方法 装置 | ||
技术领域
本发明涉及互联网数据分析领域,特别是涉及一种统计互联网用户网络访 问行为的方法和装置。
背景技术
随着互联网技术应用的越来越广泛,互联网的普及率也越来越高,人们很 多的日常工作、学习和娱乐都在网络上进行,因此,人们越来越关心用户的网 上行为,这些信息对国家相关部门来讲,可以掌握互联网络发展动态,作为制 定相关法律、法规或规范的重要依据;对企业来讲,可以了解用户的真正需求, 充分利用网络资源,开发有吸引力的增值业务,进而构建更好的盈利模式。
目前对互联网用户访问行为方面的统计分析主要有二种方式:
一是人工抽样调查的统计的方法。此类统计内容主要包括对各类网络应用 (例如搜索引擎、电子邮件、即时通信、网络媒体、数字娱乐、电子商务、网 络社区等等)的使用情况的简单统计,包括其用户规模,使用率,群体特征等 等。这些特征所需要的数据:学历、时间、地点、地域等全部来自调查问卷(参 考CNNIC发布的《2008年7月中国互联网络发展状况统计报告》的第一章第 二节“调查方法”)。其中,人工抽样方法依据随机原理抽取一部分个体作为样 本(Sample),作为研究母群体(Population)之依据。这种方法的优点是: 利用抽样技术及机率理论,可获得既定精确估计值,以代表母群体特征;但缺 点是需要大量的人力、物力、财力的支持,需要多家机构共同参与合作,每次 统计耗时都非常长,对发展特别迅速的互联网行业来讲,时效性相对较差。
二是针对特定网络应用的日志分析方法。这种方法是针对特定的网络应 用,如网页浏览、搜索引擎、网络社区等,从该网络应用服务器的系统日志中 提取相关的数据,对用户上网的时间、上网的次数、用户访问网站频道的情况 等进行统计分析。这种方法的优点是时效性强,能客观反映特定网络应用的用 户访问行为;但因该方法的分析对象为特定网络应用服务器的系统日志,所以 分析结果只能反映网络用户对特定网络应用服务的访问行为,不能把握整个互 联网的热点变化和网络访问行为的全局特征。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何实时获取 互联网用户的全局网络访问行为。
发明内容
本发明所要解决的技术问题是提供一种统计互联网用户网络访问行为的 方法,能够实时获取用户的全局网络访问行为。
本发明还提供了一种统计互联网用户网络访问行为的装置,以保证上述方 法在实际中的应用。
为了解决上述问题,本发明实施例公开了一种统计互联网用户网络访问行 为的方法,包括:
获取根域名服务器的第一域名访问信息;
获取目标网络服务器的第二域名访问信息;
基于域名建立所述第一域名访问信息与第二域名访问信息之间的映射关 系;
将所述第一域名访问信息,所述第一域名访问信息与第二域名访问信息的 映射关系保存到信息库;
依据所述映射关系,从所述信息库获得网络用户针对相应域名的访问行 为。
优选的,所述方法还包括:
从所述根域名服务器日志中提取相关数据,对所述信息库的相应数据记录 进行更新。
优选的,所述获取根域名服务器的第一域名访问信息的步骤包括:
从所述根域名服务器的日志中,计算用户对域名访问的幂律分布参数;
根据所述幂律分布参数获取用于统计分析的域名、统计针对这些域名对所 述根域名服务器的查询次数,形成第一域名访问信息。
优选的,所述目标网络服务器为递归服务器和/或网络应用服务器。
优选的,当所述目标网络服务器为递归服务器时,所述获取目标网络服务 器第二域名访问信息的步骤包括:
从递归服务器的日志中,抽取所述第一域名访问信息中确定的用于统计的 域名;
统计针对所述域名在所述递归服务器上的查询次数,形成第二域名访问信 息。
优选的,当所述目标网络服务器为网络应用服务器时,所述获取目标网络 服务器的第二域名访问信息的步骤包括:
从网络应用服务器的日志中,抽取所述第一域名访问信息中确定的用于统 计的域名;
统计针对相应域名在所述网络应用服务器上的查询次数,形成第二域名访 问信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810225462.8/2.html,转载请声明来源钻瓜专利网。