[发明专利]数据处理方法、设备、访问控制系统及存储介质有效
申请号: | 201810968739.X | 申请日: | 2018-08-23 |
公开(公告)号: | CN110858229B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张洋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 设备 访问 控制系统 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
识别预设时间段内来自同一源IP地址的访问请求所属的会话;
根据识别到的会话各自包含的访问请求的数量,从识别到的会话中,识别所包含的访问请求的数量小于设定访问阈值的会话,作为所述源IP地址对应的孤立会话;
当所述孤立会话的数量大于数量阈值时,确定所述源IP地址为目标IP,所述目标IP为爬虫IP。
2.根据权利要求1所述的方法,其特征在于,识别预设时间段内来自同一源IP地址的访问请求所属的会话,包括:
根据访问请求携带的会话标识和源IP地址,对预设时间段内接收到的访问请求进行分组;
根据所述分组的结果,确定预设时间段内来自同一源IP地址的访问请求所属的会话。
3.根据权利要求1所述的方法,其特征在于,确定所述源IP地址为爬虫IP之后,还包括:
设置所述源IP地址的阻断失效时长;或者,对所述源IP地址当前剩余的阻断失效时长进行更新。
4.根据权利要求3所述的方法,其特征在于,还包括:
在所述源IP地址的阻断失效时长内对来自所述源IP地址的访问请求进行阻断处理。
5.一种数据处理方法,其特征在于,包括:
接收当前访问请求;
将所述当前访问请求的源IP地址与已确定的目标IP进行匹配;
若匹配到与所述源IP地址相同的IP地址,则根据所述匹配到的IP地址对应的数据处理策略,对来自所述源IP地址的访问请求进行数据处理;
其中,所述目标IP的确定方式为:识别预设时间段内来自同一源IP地址的访问请求所属的会话;根据识别到的会话各自包含的访问请求的数量,从识别到的会话中,识别所包含的访问请求的数量小于设定访问阈值的会话,确定所述同一源IP地址对应的孤立会话;当所述孤立会话的数量大于数量阈值时,确定所述同一源IP地址为目标IP,所述目标IP为爬虫IP。
6.根据权利要求5所述的方法,其特征在于,根据所述匹配到的IP地址对应的数据处理策略,对来自所述源IP地址的访问请求进行数据处理,包括:
若所述匹配到的IP地址为爬虫IP,则根据所述爬虫IP的当前阻断失效时长,对所述当前阻断失效时长内来自所述源IP地址的访问请求进行阻断处理。
7.根据权利要求5所述的方法,其特征在于,确定所述同一源IP地址为爬虫IP之后,还包括:
设置所述同一源IP地址的阻断失效时长;或者,对所述同一源IP地址当前剩余的阻断失效时长进行更新。
8.根据权利要求5-7任一项所述的方法,其特征在于,将所述当前访问请求的源IP地址与已确定的目标IP进行匹配,包括:
根据所述当前访问请求,查询预设的访问控制列表ACL;
若所述当前访问请求未命中所述访问控制列表ACL中的访问控制策略,则将所述当前访问请求的源IP地址与已确定的目标IP进行匹配。
9.一种数据处理设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,用于执行所述一条或多条计算机指令以用于:识别预设时间段内来自同一源IP地址的访问请求所属的会话;根据识别到的会话各自包含的访问请求的数量,从识别到的会话中,识别所包含的访问请求的数量小于设定访问阈值的会话,作为所述源IP地址对应的孤立会话;当所述孤立会话的数量大于数量阈值时,确定所述源IP地址为目标IP,所述目标IP为爬虫IP。
10.一种存储有计算机程序的可读计算机存储介质,其特征在于,所述计算机程序被执行时,可执行权利要求1-4任一项所述方法中的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810968739.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制备TNNI3K抑制剂的方法
- 下一篇:物料检测方法和装置