[发明专利]网页浏览流量作弊的检测方法及装置有效
申请号: | 201611250145.2 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108255879B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 陈熹荣 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/954 | 分类号: | G06F16/954 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 浏览 流量 作弊 检测 方法 装置 | ||
本发明实施例提供的一种网页浏览流量作弊的检测方法及装置,可以获得用户的网页浏览日志,按照网页浏览日志生成时间的早晚顺序对获得的各网页浏览日志进行排列,生成日志列表;确定所述日志列表中的连续日志,根据所述连续日志的数量及所述连续日志的生成时间,确定该用户的网页浏览日志的生成速度;根据所述网页浏览日志的生成速度确定该用户的所述连续日志对应的网页浏览流量是否作弊。由于本发明可以根据连续日志的数量及所述连续日志的生成时间来确定网页浏览流量是否作弊,因此本发明无需对网页浏览日志进行解析,方便快捷,也降低了系统的运行负担。
技术领域
本发明涉及流量作弊检测技术领域,尤其是涉及一种网页浏览流量作弊的检测方法及装置。
背景技术
网页浏览流量是衡量一个网页的重要指标,但是互联网上存在不少web机器人、爬虫等,它们会恶意的访问网页来提升网页浏览流量。这些web机器人、爬虫访问网页带来的作弊的网页浏览流量往往数目巨大,导致后续对网页浏览流量进行分析的准确性大大降低。
为了检测出作弊的网页浏览流量,目前业内普遍使用Google Analysis进行检测。Google Analysis通过对网页浏览日志进行解析,通过解析结果得出网页浏览过程中的跳出率、平均访问时间、平均页面访问深度等参数来判断网页浏览流量是否为作弊流量。
但跳出率、平均访问时间、页面访问深度需要对网页浏览日志进行解析才能得到,而需要解析的网页浏览日志数量较多,因此现有技术需要花费较长的时间才能确定网页浏览流量是否为作弊浏览,同时,对大量的网页浏览日志进行解析也给系统带来了很大的运行负担。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网页浏览流量作弊的检测方法及装置,方案如下:
一种网页浏览流量作弊的检测方法,包括:
获得用户的网页浏览日志,按照网页浏览日志生成时间的早晚顺序对获得的各网页浏览日志进行排列,生成日志列表;
确定所述日志列表中的连续日志,所述连续日志中相邻的两个网页浏览日志生成时间的时间间隔不大于预设间隔;
根据所述连续日志的数量及所述连续日志的生成时间,确定该用户的网页浏览日志的生成速度;
根据所述网页浏览日志的生成速度确定该用户的所述连续日志对应的网页浏览流量是否作弊。
可选的,所述方法还包括:
确定该用户的所述连续日志对应的网页浏览流量作弊时,为所述连续日志添加作弊标识。
可选的,所述方法还包括:
判断该用户的具有作弊标识的网页浏览日志的数量是否大于预设数量,如果是,则删除该用户的预设比例的具有作弊标识的网页浏览日志。
可选的,所述根据所述连续日志的数量及所述连续日志的生成时间,确定该用户的网页浏览日志的生成速度,包括:
确定所述连续日志中网页浏览日志的最早生成时间T1、所述连续日志中网页浏览日志的最晚生成时间Tn及所述连续日志的数量n;
根据所述T1、所述Tn和所述n计算得到该用户的网页浏览日志的生成速度。
可选的,根据所述网页浏览日志的生成速度确定该用户的所述连续日志对应的网页浏览流量是否作弊,包括:
确定所述网页浏览日志的生成速度所在的速度区间,确定所述Tn与T1之间的时间间隔所在的时间区间,根据确定的所述速度区间及确定的所述时间区间确定该用户的所述连续日志对应的网页浏览流量是否作弊。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611250145.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户信息处理方法及相关装置
- 下一篇:数据处理方法及装置