[发明专利]一种页面曝光量的监控方法和装置有效
申请号: | 201610039116.5 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105653724B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 刘姗 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06Q30/02 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 页面 曝光 监控 方法 装置 | ||
1.一种页面曝光量的监控方法,所述页面曝光量是指在设定时间内页面点击展示的次数,其特征在于,所述方法包括:
获取点击页面的用户IP地址,在预设的内存缓冲区保存所述用户IP地址的点击记录;
在异常IP地址集合中查找是否包含所述用户IP地址,所述异常IP地址集合包括第一子集合和第二子集合,所述第一子集合是搜索引擎提取到的网络爬虫IP地址集合,所述第二子集合是在设定时间段内访问所述页面的次数超出访问次数阈值的IP地址集合;
如果所述异常IP地址集合中包含所述用户IP地址,在所述用户IP地址所对应的点击记录中添加异常点击标记;
如果所述异常IP地址集合中不包含所述用户IP地址,则在所述点击记录中查找在设定时间段内访问所述页面的次数超出访问次数阈值的IP地址;
将在设定时间段内访问所述页面次数超出访问次数阈值的IP地址所对应的点击记录中添加异常点击标记;
根据具有异常点击标记的点击记录和所述点击记录确定所述页面的曝光量。
2.如权利要求1所述的方法,其特征在于,所述方法还包括更新异常IP地址集合,包括:
根据网络爬虫在各搜索引擎提取到的网络爬虫名单的IP地址段更新所述第一子集合;
根据所述访问次数阈值和所述点击记录更新所述第二子集合。
3.如权利要求2所述的方法,其特征在于,所述根据所述访问次数阈值和所述点击记录更新所述第二子集合,包括:
在第一时间段内统计所述点击记录,将访问所述页面的次数超出访问次数阈值的IP地址加入第二子集合;
在第二时间段内统计所述点击记录,将访问所述页面的次数超出第二访问次数阈值的IP地址添加到第二子集合,所述第二时间段是由多个连续的第一时间段组成。
4.如权利要求2所述的方法,其特征在于,所述根据所述访问次数阈值和所述点击记录更新所述第二子集合还包括:
在固定时段内,比较所述点击记录中具有异常点击标记的IP地址和第二子集合中的IP地址;
将第二子集合中与所述点击记录中具有异常点击标记的IP地址不同的IP地址设为误判IP地址;
将所述误判IP地址从所述第二子集合中删除。
5.如权利要求2所述的方法,其特征在于,所述根据所述访问次数阈值和所述点击记录更新所述第二子集合还包括:
通过降低或提高阈值调整所述访问次数阈值;
将访问所述页面次数与调整后的访问次数阈值比较调整所述点击记录中的异常点击标记;
根据所述调整后的异常点击记录,在第二子集合中添加或删除IP地址。
6.如权利要求1所述的方法,其特征在于,所述根据具有异常点击标记的点击记录和所述点击记录确定所述页面的曝光量包括:
在设定时间段内提取所述点击记录;
将在该时间段内的所述点击记录的数量与具有异常点击标记的点击记录的数量作运算确定所述页面在所述设定时段内的曝光量。
7.如权利要求6所述的方法,其特征在于,所述根据具有异常点击标记的点击记录和所述点击记录确定所述页面的曝光量还包括曝光量补偿:
更改设定时间段的时间长度或调整访问次数阈值的大小;
统计在更改设定时间段的时间长度或调整访问次数阈值的大小后的点击记录和异常点击标记,确定所述页面曝光量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610039116.5/1.html,转载请声明来源钻瓜专利网。