[发明专利]恶意爬虫检测方法、装置、电子设备及存储介质有效
申请号: | 201811652954.5 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109474640B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 卢思成;王飞 | 申请(专利权)人: | 奇安信科技集团股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 100088 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 爬虫 检测 方法 装置 电子设备 存储 介质 | ||
1.一种恶意爬虫检测方法,其特征在于,包括:
获取待检测的网络地址的访问信息,所述访问信息包括所述网络地址访问目标网站的访问频率;
获取所述访问信息内的所述访问频率,并判断所述访问频率是否大于第一预设阈值;
当所述访问频率大于所述第一预设阈值,则判断所述网络地址是否为伪装用户代理商;
若所述网络地址不是伪装用户代理商,则在所述访问信息内查找是否有referer字段,当没有所述referer字段或所述referer字段为空时,判断所述访问频率是否大于第二预设阈值,若是,则确定所述网络地址通过恶意爬虫访问所述目标网站;
其中,所述伪装用户代理商是指通过代码库访问所述目标网站的代理商。
2.根据权利要求1所述的恶意爬虫检测方法,其特征在于,所述判断所述网络地址是否为伪装用户代理商之后,还包括:
若所述网络地址是伪装用户代理商,则判断所述访问频率是否大于第三预设阈值;
若大于所述第三预设阈值,则确定所述网络地址通过恶意爬虫访问所述目标网站;
若不大于所述第三预设阈值,则当所述网络地址不是通过认证爬虫访问所述目标网站时,判断所述目标网站是否允许通过爬虫访问,若不允许,则判断所述访问频率是否大于第四预设阈值,若大于,则确定所述网络地址通过恶意爬虫访问所述目标网站;
其中,所述认证爬虫为搜索引擎爬虫。
3.根据权利要求2所述的恶意爬虫检测方法,其特征在于,所述获取待检测的网络地址的访问信息之前包括:
判断待检测的所述网络地址是否为外部网络地址;
若所述网络地址为外部网络地址,则执行获取待检测的网络地址的访问信息的步骤。
4.根据权利要求1所述的恶意爬虫检测方法,其特征在于,所述确定所述网络地址通过恶意爬虫访问所述目标网站之前,包括:
获取所述网络地址通过恶意爬虫访问所述目标网站时的时间点;
判断所述时间点的每秒查询率是否在预设范围内,若不在预设范围内,则确定所述网络地址通过恶意爬虫访问所述目标网站。
5.一种恶意爬虫检测装置,其特征在于,包括:
第一获取模块,用于获取待检测的网络地址的访问信息,所述访问信息包括所述网络地址访问目标网站的访问频率;
第二获取模块,用于获取所述访问信息内的所述访问频率,并判断所述访问频率是否大于第一预设阈值;
第一判断模块,用于当所述访问频率大于所述第一预设阈值,则判断所述网络地址是否为伪装用户代理商;
确定模块,用于若所述网络地址不是伪装用户代理商,则在所述访问信息内查找是否有referer字段,当没有所述referer字段或所述referer字段为空时,判断所述访问频率是否大于第二预设阈值,若是,则确定所述网络地址通过恶意爬虫访问所述目标网站;
其中,所述伪装用户代理商是指通过代码库访问所述目标网站的代理商。
6.根据权利要求5所述的恶意爬虫检测装置,其特征在于,所述装置还包括:
第一判断子模块,用于若所述网络地址是伪装用户代理商,则判断所述访问频率是否大于第三预设阈值;
确定子模块,用于若大于所述第三预设阈值,则确定所述网络地址通过恶意爬虫访问所述目标网站;
确定子模块,用于若不大于所述第三预设阈值,则当所述网络地址不是通过认证爬虫访问所述目标网站时,判断所述目标网站是否允许通过爬虫访问,若不允许,则判断所述访问频率是否大于第四预设阈值,若大于,则确定所述网络地址通过恶意爬虫访问所述目标网站;
其中,所述认证爬虫为搜索引擎爬虫。
7.根据权利要求6所述的恶意爬虫检测装置,其特征在于,所述装置还包括:
第二判断模块,用于判断待检测的所述网络地址是否为外部网络地址;
第一获取模块,还用于若所述网络地址为外部网络地址,则执行获取待检测的网络地址的访问信息的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司,未经奇安信科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811652954.5/1.html,转载请声明来源钻瓜专利网。