[发明专利]一种新的防护网络爬虫攻击的方法在审

专利信息
申请号: 202011636566.5 申请日: 2020-12-31
公开(公告)号: CN112866203A 公开(公告)日: 2021-05-28
发明(设计)人: 王小东;张身高 申请(专利权)人: 北京天地和兴科技有限公司
主分类号: H04L29/06 分类号: H04L29/06
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 100193 北京市海淀区东*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 防护 网络 爬虫 攻击 方法
【说明书】:

发明属于网络技术领域,尤其是一种新的防护网络爬虫攻击的方法,针对发防护效果不佳的问题,现提出以下方案,包括以下步骤:S1:对用户行为信息进行收集;S2:网络爬虫数据过滤模块对用户行为信息中网络爬虫存储残留的数据进行过滤清除;S3:信息录入后经用户行为信息储存单元储存至用户行为信息数据库;S4:用户行为信息挖掘单元根据用户行为信息数据库里的用户行为信息深度挖掘出用户可能的正常行为信息;S5:当网络信息接收单元接收到网络信息时,网络攻击判断单元对信息进行比对;S6:当结果不同时则启动网络防御系统。本发明可以对网络爬虫存储的数据进行清除,从根本上进行网络防护,提高了防护的精准性。

技术领域

本发明涉及网络技术领域,尤其涉及一种新的防护网络爬虫攻击的方法。

背景技术

网络爬虫,又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索。

因网络爬虫会自动抓取和记录用户行为信息等,若不对网络爬虫进行防护和处理,极有可能因网络爬虫存储记录的用户信息导致计算机被病毒入侵。

发明内容

基于背景技术中提出的技术问题,本发明提出了一种新的防护网络爬虫攻击的方法。

本发明提出的一种新的防护网络爬虫攻击的方法,包括用户行为信息收集单元、用户行为信息数据库和网络信息接收单元,所述用户行为信息收集单元和用户行为信息处理单元相连,所述用户行为信息处理单元和用户行为信息录入单元相连,所述用户行为信息录入单元和用户行为信息储存单元相连,所述用户行为信息储存单元和用户行为信息数据库相连,所述用户行为信息数据库和用户行为信息挖掘单元相连,所述网络信息接收单元和网络攻击判断单元相连,所述网络攻击判断单元和用户行为信息数据库相互连接,所述网络攻击判断单元和网络防御启动单元相连;

所述用户行为信息处理单元包括网络爬虫数据过滤模块和有效行为数据提取模块,所述网络爬虫数据过滤模块和有效行为数据提取模块相连;

所述网络攻击判断单元包括信息比对模块;

具体防护方法包括以下步骤:

S1:当用户使用电子设备产生用户行为信息时,用户行为信息收集单元对用户行为信息进行收集;

S2:收集到的用户行为信息进入用户行为信息处理单元,网络爬虫数据过滤模块对用户行为信息中网络爬虫存储残留的数据进行过滤清除,有效行为数据提取模块对有效安全的信息进行提取;

S3:提取到的有效安全信息进入用户行为信息录入单元录入,并经用户行为信息储存单元储存至用户行为信息数据库;

S4:用户行为信息挖掘单元根据用户行为信息数据库里的用户行为信息深度挖掘出用户可能的正常行为信息,并将挖掘出的行为信息传递给用户行为信息录入单元进行录入并利用用户行为信息储存单元储存至用户行为信息数据库;

S5:当网络信息接收单元接收到网络信息时,网络攻击判断单元的信息比对模块将网络信息与用户行为信息数据库内的行为信息进行比对;

S6:当比对结果相同时则判断为正常网络信息,电子设备正常运行,当比对结果不同时则判断为异常攻击信息,则网络防御启动单元将网络防御系统启动对网络攻击进行防护。

优选地,所述用户行为信息收集单元用于对用户的行为信息进行收集,所述用户行为信息处理单元用于对收集到的用户行为信息进行分析处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天地和兴科技有限公司,未经北京天地和兴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011636566.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top