[发明专利]一种基于非对称二次加密的反爬虫方法及系统在审

申请号：	202110895961.3	申请日：	2021-08-05
公开（公告）号：	CN113609501A	公开（公告）日：	2021-11-05
发明（设计）人：	游棉州;钟亚妹	申请（专利权）人：	广州南洋理工职业学院
主分类号：	G06F21/60	分类号：	G06F21/60;G06F21/62;G06F21/31;G06F21/46;G06F9/54;H04L29/06
代理公司：	深圳市创富知识产权代理有限公司 44367	代理人：	叶灿才
地址：	510900 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于对称二次加密爬虫方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于非对称二次加密的反爬虫方法及系统，该方法包括：验证用户登录；基于客户端进行一次加密，生成sign01；响应于用户访问，调用RPC微服务验证sign01并在验证通过后进行二次加密，生成sign02；用户基于sign02访问目标服务器，目标服务器验证成功，返回数据。该系统包括：客户端、用户端和服务器端。通过使用本发明，实现反爬虫的目的，保证信息的安全。本发明作为一种基于非对称二次加密的反爬虫方法及系统，可广泛应用于网络数据安全保护领域。

技术领域

本发明涉及网络数据安全保护领域，尤其涉及一种基于非对称二次加密的反爬虫方法及系统。

背景技术

互联网上有着数不尽的网页，网页上存储着海量的信息，如果能得到这些数据进行数据分析，那么将会产生巨大的商业价值。因此也就产生了爬虫，一种能用于自动获取网页内容，并自动进行页面解析，提取数据相应内容的程序。现有的签名验证技术方案的缺点是该签名是在浏览器的前端生成，爬虫工程师可以先通过查看浏览器中的Javascript代码，找到生成签名的函数方法，进而进行伪造签名，破解反爬虫。

发明内容

为了解决上述技术问题，本发明的目的是提供一种基于非对称二次加密的反爬虫方法及系统，将第二次加密的加密函数放在服务器端，使得爬虫工程师无法破解加密参数的生成规则的，从而保护数据。

本发明所采用的第一技术方案是：一种基于非对称二次加密的反爬虫方法，包括以下步骤：

验证用户登录；

基于客户端进行一次加密，生成sign01；

响应于用户访问，调用RPC微服务验证sign01并在验证通过后进行二次加密，生成sign02；

用户基于sign02访问目标服务器，目标服务器验证成功，返回数据。

进一步，所述验证用户登录这一步骤，还包括：

用户提交账号密码登录并把cookies值写到客户端；

记录cookies值。

进一步，所述基于客户端进行一次加密，生成sign01这一步骤，其具体包括：

判断到用户登录成功，客户端基于预设规则通过javascript生成代码，得到sign01参数。