[发明专利]基于网页访问行为记录的采集方法及装置在审
申请号: | 201610629463.3 | 申请日: | 2016-08-03 |
公开(公告)号: | CN107688568A | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 韩江 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 郝传鑫,熊永强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网页 访问 行为 记录 采集 方法 装置 | ||
1.一种基于网页访问行为记录的采集方法,其特征在于,所述方法包括:
检测源网页的页面上触发的网页跳转操作,获取所述源网页的源链接以及所述网页跳转操作的目标链接;
跳转至所述目标链接对应的目标网页,展示所述目标网页;
根据所述目标链接和所述源链接生成相应的行为记录,将所述行为记录存储到浏览器缓存中;
检测所述目标网页上的预指定的监测控件的触发操作,根据所述监测控件对应的链接地址生成第一行为记录;
在所述浏览器缓存中查找与所述目标网页的目标链接对应的第二行为记录;
根据所述第一行为记录和所述查找到的第二行为记录生成上传数据上报给服务器。
2.根据权利要求1所述的基于网页访问行为记录的采集方法,其特征在于,所述检测源网页的页面上触发的网页跳转操作之后还包括:
获取与所述目标链接对应的所述网页跳转操作的时间戳;
所述根据所述目标链接和所述源链接生成相应的行为记录还包括:
在所述行为记录中加入与所述目标链接对应的时间戳。
3.根据权利要求2所述的基于网页访问行为记录的采集方法,其特征在于,所述将所述行为记录存储到浏览器缓存中之前还包括:
在所述浏览器缓存中分配行为记录的存储队列,设置所述存储队列可包含行为记录的上限;
所述将所述行为记录存储到浏览器缓存中还包括:
将所述行为记录存储到浏览器缓存中的存储队列的队尾。
4.根据权利要求3所述的基于网页访问行为记录的采集方法,其特征在于,所述将所述行为记录存储到浏览器缓存中的存储队列的队尾之前还包括:
在所述存储队列中包含的行为记录的数量达到上限时,删除所述存储队列的队首的存储记录。
5.根据权利要求2所述的基于网页访问行为记录的采集方法,其特征在于,所述根据所述第一行为记录和所述查找到的第二行为记录生成上传数据上报给服务器之后还包括:
在所述浏览器缓存中的存储队列中删除所述行为记录。
6.根据权利要求2至5任一项所述的基于网页访问行为记录的采集方法,其特征在于,所述行为记录为映射项的数据结构,所述根据所述目标链接和所述源链接生成相应的行为记录还包括:
根据所述目标链接生成映射项的键,根据所述源链接生成映射项的值,所述键和值构成的映射项作为行为记录;
所述在所述浏览器缓存中查找与所述目标网页的目标链接对应的第二行为记录为:
在所述浏览器缓存中查找键与所述目标网页的目标链接对应的第二行为记录。
7.根据权利要求6所述的基于网页访问行为记录的采集方法,其特征在于,所述将所述行为记录存储到浏览器缓存中还包括:
在所述浏览器缓存的存储队列中包含第三行为记录,且所述第三行为记录的键与所述目标链接对应时,根据所述源链接更新所述第三行为记录的值。
8.根据权利要求6所述的基于网页访问行为记录的采集方法,其特征在于,所述根据所述第一行为记录和所述查找到的第二行为记录生成上传数据上报给服务器还包括:
在所述浏览器缓存中查找与值与所述目标网页的目标链接对应的第四行为记录;
在所述第四行为记录的时间戳早于所述第二行为记录时,在所述上传数据中加入所述第四行为记录。
9.根据权利要求6所述的基于网页访问行为记录的采集方法,其特征在于,所述根据所述目标链接生成映射项的键为:
将对所述目标链接进行哈希运算得到的哈希值作为映射项的键;
所述根据所述源链接生成映射项的值为:
将所述源链接进行JSON数据格式的封装后作为映射项的值。
10.根据权利要求1至5任一项所述的基于网页访问行为记录的采集方法,其特征在于,所述源链接与所述目标链接的域名不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610629463.3/1.html,转载请声明来源钻瓜专利网。