[发明专利]一种识别作弊流量的方法及装置有效
申请号: | 201710907062.4 | 申请日: | 2017-09-29 |
公开(公告)号: | CN109586990B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 刘振华 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 作弊 流量 方法 装置 | ||
本发明公开了一种识别作弊流量的方法及装置,可以获取来自设定渠道的设定时长内的访问流量的页面停留时长分布,并将该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布进行对比。如果该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布不同,并且其页面停留时长分布呈现作弊流量典型的页面停留时长U型分布,则可以判断该访问流量为作弊流量。本发明技术方案从访问流量的页面停留时长分布入手判断其是否为作弊流量,具备更高的判断准确性。
技术领域
本发明涉及流量监控技术领域,尤其涉及一种识别作弊流量的方法及装置。
背景技术
互联网广告引流是各大网站获取新流量的重要方式之一。在互联网广告引流方案中,广告主通过广告售卖方(广告渠道)展示广告链接,用户在广告售卖方网站点击广告主的广告链接,访问广告主网站,即完成了广告引流的目的。
而部分广告售卖方经常利用机器(计算机)模拟用户点击广告主的广告链接,以流量作弊的方法欺骗广告主,以损害广告主的利益而获取收益。因此,对于广告主来说,识别作弊流量,是提高广告效益的重要手段。常用的识别作弊流量的方法是,计算多个指标维度(广告来源、浏览器版本、操作系统等)下页面访问的平均停留时间和停留页面,作为识别作弊流量的判断指标。这些指标虽然易于计算和展示,但是也容易被机器模仿,由此导致,以页面访问的平均停留时间和停留页面为依据,并不能准确地识别作弊流量。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的识别作弊流量的方法及装置。具体方案如下:
一种识别作弊流量的方法,包括:
获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;
如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
可选的,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:
分别统计所述访问流量中的各个页面访问的页面停留时长;
根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
可选的,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710907062.4/2.html,转载请声明来源钻瓜专利网。