[发明专利]一种识别网页爬虫的方法和装置有效
申请号: | 201110130432.0 | 申请日: | 2011-05-19 |
公开(公告)号: | CN102790700A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | 叶润国;肖小剑 | 申请(专利权)人: | 北京启明星辰信息技术股份有限公司;北京启明星辰信息安全技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/06;G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;王漪 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种识别网页爬虫的方法和装置,涉及网络安全技术领域。本发明公开的方法包括:统计Web服务器对所有Web页面请求的平均响应时间,获取一段时间内Web客户端到Web服务器的Web网页请求,测量出各相邻Web网页请求时间间隔以及各Web页面请求响应时间,根据Web页面请求响应时间修正相邻Web网页请求时间间隔,判定修正后的相邻Web页面请求时间间隔是否大于或等于一预定的相邻网页请求时间间隔阈值δ,根据各判断结果是否满足预设条件,来判断所述web客户端的操作是否为网络爬虫。本发明的实施例可以简单、快速地检测出隐藏的网页爬虫,并且适用性强,能够为后续的安全响应提供宝贵的响应时间。 | ||
搜索关键词: | 一种 识别 网页 爬虫 方法 装置 | ||
【主权项】:
一种识别网页爬虫的方法,其特征在于,该方法包括:统计Web服务器对所有Web页面请求的平均响应时间,获取一段时间内Web客户端到Web服务器的Web网页请求,测量出各相邻Web网页请求时间间隔以及各Web页面请求响应时间,根据Web页面请求响应时间修正相邻Web网页请求时间间隔,判定修正后的相邻Web页面请求时间间隔是否大于或等于一预定的相邻网页请求时间间隔阈值δ,根据各判断结果是否满足预设条件,来判断所述web客户端的操作是否为网络爬虫。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京启明星辰信息技术股份有限公司;北京启明星辰信息安全技术有限公司,未经北京启明星辰信息技术股份有限公司;北京启明星辰信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110130432.0/,转载请声明来源钻瓜专利网。