[发明专利]基于时间分片的Web用户浏览访问矩阵的构造方法有效

专利信息
申请号: 201210529936.4 申请日: 2012-12-11
公开(公告)号: CN102982166A 公开(公告)日: 2013-03-20
发明(设计)人: 吴家皋;袁堂朋;邹志强 申请(专利权)人: 南京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 奚幼坚
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于时间分片的Web用户浏览访问矩阵的构造方法,根据用户在服务器的访问记录,采用时间分片的方法,将用户访问记录按访问的月份、星期和每天时段分成三类,分别转换成为三个访问矩阵数组,并为每类访问矩阵赋予相应的权重参数,最终得到一个平均访问矩阵。当用户访问网站的时候,将该平均访问矩阵作为输入,即可利用现有的偏爱路径算法得到用户偏爱浏览路径。本方法反映了不同时间用户的偏爱浏览行为也不同的特点,因而能获得更准确的用户偏爱浏览路径。同时,不同时间访问矩阵的权重参数可调节,增加了本方法的灵活性和适应性。
搜索关键词: 基于 时间 分片 web 用户 浏览 访问 矩阵 构造 方法
【主权项】:
1.基于时间分片的Web用户浏览访问矩阵的构造方法,其特征是:在数据清洗阶段,根据互联网信息服务中的日志文件,建立并存储Web用户的访问记录表,然后,根据Web用户访问记录表中的访问时间,按月份、星期、每天时段三种不同粒度分别为每个Web用户建立三个时间分片的访问矩阵数组,当用户访问网站的时候,按照用户访问时间及权重计算得到一个平均访问矩阵,将该平均访问矩阵作为输入,利用现有的偏爱路径算法得到用户偏爱浏览路径;包括如下步骤:步骤1,数据清洗阶段,根据互联网信息服务中的日志文件,建立并存储Web用户的访问记录表,每条记录表示某个用户在一个访问时间点,从上一个引用页面跳转到当前访问页面的过程;记录表的结构包括:用户IP地址、用户操作系统、用户浏览器、用户访问时间、引用页面、访问页面,其中,根据用户访问IP地址、用户操作系统和用户浏览器将不同的用户区分开来;步骤2,建立Web用户浏览访问矩阵:根据Web用户访问记录表中的访问时间,按月份、星期、每天时段三种不同粒度进行时间分片,分别为每个Web用户建立三个时间分片的访问矩阵数组,包括:一个有12个元素的月份访问矩阵数组表示1月~12月;一个有7个元素的星期访问矩阵表示星期一~星期天;一个有3个元素的每天时段访问矩阵表示8:00~12:00、12:00~18:00和18:00~次日8:00三个时段,每个访问矩阵的结构是相同的,行表示引用页面的网址,列表示当前页面的网址,元素值为支持度,即用户由引用页面跳转到访当前页面路径的访问次数,另外,访问矩阵的行列都要添一个空值,在行向量里出现表示用户不通过网页链接而是通过直接输入网址、用书签来访问或从其它网站链接进入当前访问网页;在列向量里出现表示用户在此页结束浏览或链接到其它网站网页;步骤3,计算平均访问矩阵:当Web用户访问网站时候,系统根据访问时间,计算出该访问时间的月份i、星期j、每天时段k,并从三个访问矩阵数组M,W,D中分别取出相对应的M[i],W[j],D[k]矩阵元素,并用公式(1)求平均访问矩阵N:N=α·M[i]+β·W[j]+γ·D[k]     (1)其中,α,β,γ分别是月份访问矩阵、星期访问矩阵、每天时段访问矩阵的权重参数,且满足:0≤α,β,γ≤1,α+β+γ=1;步骤4,利用现有的用户偏爱路径算法,以平均访问矩阵N作为输入,得到用户偏爱浏览路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210529936.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top