[发明专利]一种分级校验防爬虫的方法、装置、设备及存储介质在审

专利信息
申请号: 202210165100.4 申请日: 2022-02-17
公开(公告)号: CN114553541A 公开(公告)日: 2022-05-27
发明(设计)人: 王珏;朱亮 申请(专利权)人: 苏州良医汇网络科技有限公司
主分类号: H04L9/40 分类号: H04L9/40;G06F16/951;G06N3/04
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 王广浩
地址: 215000 江苏省苏州市工业园区*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分级 校验 爬虫 方法 装置 设备 存储 介质
【权利要求书】:

1.一种分级校验防爬虫方法,其特征在于,包括:

接受用户请求,获取横向时间访问数据;

利用所述横向时间访问数据统计得到横向时间访问次数;

利用所述横向时间访问次数计算风险系数;

判断所述风险系数是否在预设校验异常范围内;

若所述风险系数在所述预设校验异常范围内,则根据所述风险系数进行风险值评估,判断用户请求风险分级,所述用户请求风险分级包括低风险、中风险、高风险;

当所述用户请求风险分级为高风险时,进行登录拦截校验,当所述用户请求风险分级为中风险时,进行验证码校验,当所述用户请求风险分级为低风险时,则允许请求,返回数据并存储至数据库;

若所述登录拦截校验或所述验证码校验失败,则判定为爬虫,封禁ip,若所述登录成功或所述验证码校验成功,则允许请求并将所述风险系数清零。

2.根据权利要求1所述的分级校验防爬虫方法,其特征在于,所述利用所述横向时间访问数据统计得到横向时间访问次数包括:

将所述横向时间访问数据存储至数据库并设置过期时间为预设时长;

利用所述横向时间访问数据的唯一标识key统计横向时间访问次数,所述横向时间访问次数为同一时间内用户并发的重复行为,所述横向时间访问数据的唯一标识key包含ip和访问端信息。

3.根据权利要求2所述的分级校验防爬虫方法,其特征在于,所述唯一标识key为目标url和当前时间minute的Md5加密key。

4.根据权利要求1所述的分级校验防爬虫方法,其特征在于,所述利用所述横向时间访问次数计算风险系数包括:

所述风险系数score计算规则为:

score=d+c/r+m

其中,c为所述用户的横向时间访问次数,r为请求阈值系数,m为根据用户行为风险预设的不同分数,d为根据两次相同访问时间间隔预设的分数,An为在每次用户操作时,采用预先训练好的RNN+SoftMax模型选取预先定义的分值数组中的一个分值,并对每次操作选取的数值进行累加得到的分数:

An=tanh(Wα×An-1+Wβ×Tn+Basic)

其中,n为循环迭代次数,Wα为m*n矩阵,Wβ为m*n矩阵,T为矩阵第一列,Basic为m*1矩阵,m为常量;

所述RNN+SoftMax模型的的损失函数为:

其中,N为样本数,M为类别数,Yic为真实数据概率,Pic属于类别为i的预测概率,x为修正参数。

5.根据权利要求1所述的分级校验防爬虫方法,其特征在于,所述判断所述风险系数是否在预设的校验异常范围内包括:

若所述风险系数不在所述预设校验异常范围内,则判断所述横向时间访问次数是否超过访问次数上限,若超过所述访问次数上限,则判定为爬虫;

若所述横向时间访问次数未超过所述访问次数上限,且所述横向时间访问数据的唯一标识key存在合法前置访问,则允许用户请求,正常返回数据并存储至数据库。

6.根据权利要求1所述的分级校验防爬虫方法,其特征在于,所述若所述风险系数在所述预设校验异常范围内,则根据所述风险系数进行风险值评估,判断用户请求风险分级,所述用户请求风险分级包括低风险、中风险、高风险包括:

所述预设校验异常范围划分为预设低风险范围、预设中风险范围、预设高风险范围;

若所述用户的横向时间访问次数未超过访问次数上限,若所述横向时间访问数据的唯一标识key不存在合法前置访问,且所述风险系数在所述预设低风险范围内,则判定为所述低风险;

若所述用户的横向时间访问次数未超过所述访问次数上限时,且所述横向时间访问数据的唯一标识key存在合法前置访问,且所述风险系数在所述预设中风险范围内,则判定为所述中风险;

若所述用户的横向时间访问次数未超过所述访问次数上限时,但所述横向时间访问数据的唯一标识key不存在合法前置访问,且所述风险系数在所述预设高风险范围内,则判定为所述高风险。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州良医汇网络科技有限公司,未经苏州良医汇网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210165100.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top