[发明专利]一种基于通讯网络报文的网站网页评价系统有效
申请号: | 201110162100.0 | 申请日: | 2011-06-16 |
公开(公告)号: | CN102289447A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 刘书良;罗峰;黄苏支;李娜;王琪;张玉波;阎飞飞;刘生;姚震环 | 申请(专利权)人: | 北京亿赞普网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 李贺香 |
地址: | 100081 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通讯 网络 报文 网站 网页 评价 系统 | ||
技术领域
本发明涉及网络用户特征分析领域,尤其涉及一种通过跨网网络报文对用户上网的各种行为进行关联分析、从而得到一个特定人群在特定时间内的上网特征的基于通讯网络报文的网站网页评价系统。
背景技术
随着互联网技术的发展,用户对互联网内容和应用服务的要求已经从海量演进为个性,如何精准的定位用户的行为特性和网站本身的内容特性和提供服务的级别,并将两者有机的结合起来是急需解决的问题和技术难点。目前用来分析用户上网特征的方法主要有以下几种:
第一,通过在少量用户电脑上装插件、客户端或者cookie,来收集各个网页的访问数据,从而对网站网页的流量、访问用户进行统计分析。这种方法技术门槛低,使用简便,是目前业内较通用的分析方法,该方案的一个最大缺陷是由于收集的用户数据较少,只能做抽样统计分析工作,无法完成深度数据分析。与此同时,由于客户端和cookie两种形式都存安装困难,有效期短的问题,在分析的准确度上存在问题。客户端的安装需要用户的支持和操作,一方面样本库完整性的建立是存在偏差的,同时在样本的数量上也会存在困难。如果强行给用户安装客户端,势必会给用户带来烦恼同时也会引起投诉。Cookie的植入也会因为有效期的问题而产生统计上的缺失。
第二,利用网络爬虫技术,抓取网页,分析网页内容和网页之间的链接关系。通过分析网页内容,对网页进行分类、聚类或者关键词抽取。通过分析网页之间的链接关系,来衡量一个网页的重要程度。这种方法存在如下缺陷,首先,无法从用户维度出发,对网页进行分析,也无法对网页的流量特性和网页的目标受众进行评价。其次,需要网络爬虫、网页抽取、中心词抽取及链接分析等技术,需要消耗大量的运算存储资源。
发明内容
本发明的目的在于提供采用通讯报文分析方法来评价网站的基于通讯网络报文的网站网页评价系统。
为了实现上述目的,本发明采用的技术方案如下:
本发明的基于通讯网络报文的网站网页评价系统,包括:
用于将原始报文数据进行归类的报文分类模块;
用于通过对原始报文数据进行挖掘、识别用户身份的用户身份识别模块;
用于根据报文分类模块分类后的报文及用户身份识别模块识别出的用户身份信息,对用户在互联网上的行为进行还原的用户行为还原模块;
用于存储所述行为还原模块还原的用户行为的用户行为库;
提取用户行为库中的用户行为根据相关网站、网页进行统计整合的网站网页信息统计整合模块;
用于根根网站网页信息统计整合模块处理过的信息从多个维度统计网站网页上各个用户行为的执行次数,从而实现对网站网页的评价的网站网页评价模块。
优选的,所述基于通讯网络报文的网站网页评价系统还包括:
关联分析模块:用于提取用户行为库中的用户行为,采用关联分析的方法进行对分析,得出与网站或网页相关联的用户行为;
分类模块:用于提取关联分析模块提供网站网页关联的用户行为,作为网站网页特征向量的一部分,然后用数学模型对网站进行分类,得出网站网页所属的类别;
所述的分类模块将分析得到的网站网页所属类别传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。
更优选的,所述基于通讯网络报文的网站网页评价系统还包括:聚类模块:通过关联分析模块提供的与网站网页关联的用户行为,作为网站网页特征向量的一部分,然后用数学模型对网站进行聚类,找出与目标网站网页相似的网站网页;
所述的聚类模块将分析得到的与目标网站网页相似的网站网页传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。
优选的,所述基于通讯网络报文的网站网页评价系统还包括:
搜索关键词提取模块:通过提取用户行为库中的搜索点击行为,分析搜索引擎带到某个具体网站的点击行为;
分类模块:用于将通过搜索关键词提取模块提取的搜索关键词,作为网站网页特征向量的一部分,然后用数学模型对网站进行分类,得出网站网页所属的类别;
所述的分类模块将分析得到的网站网页所属类别传递给网站网页信息统计整合模块进行整合,并由网站网页信息统计整合模块将整合后的数据传递给网站网页评价模块,用于其对网站网页进行评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亿赞普网络技术有限公司,未经北京亿赞普网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110162100.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在无线通信系统中报告集合的测量的方法
- 下一篇:抽吸装置