[发明专利]一种基于非对称二次加密的反爬虫方法及系统在审
申请号: | 202110895961.3 | 申请日: | 2021-08-05 |
公开(公告)号: | CN113609501A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 游棉州;钟亚妹 | 申请(专利权)人: | 广州南洋理工职业学院 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/31;G06F21/46;G06F9/54;H04L29/06 |
代理公司: | 深圳市创富知识产权代理有限公司 44367 | 代理人: | 叶灿才 |
地址: | 510900 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对称 二次 加密 爬虫 方法 系统 | ||
本发明公开了一种基于非对称二次加密的反爬虫方法及系统,该方法包括:验证用户登录;基于客户端进行一次加密,生成sign01;响应于用户访问,调用RPC微服务验证sign01并在验证通过后进行二次加密,生成sign02;用户基于sign02访问目标服务器,目标服务器验证成功,返回数据。该系统包括:客户端、用户端和服务器端。通过使用本发明,实现反爬虫的目的,保证信息的安全。本发明作为一种基于非对称二次加密的反爬虫方法及系统,可广泛应用于网络数据安全保护领域。
技术领域
本发明涉及网络数据安全保护领域,尤其涉及一种基于非对称二次加密的反爬虫方法及系统。
背景技术
互联网上有着数不尽的网页,网页上存储着海量的信息,如果能得到这些数据进行数据分析,那么将会产生巨大的商业价值。因此也就产生了爬虫,一种能用于自动获取网页内容,并自动进行页面解析,提取数据相应内容的程序。现有的签名验证技术方案的缺点是该签名是在浏览器的前端生成,爬虫工程师可以先通过查看浏览器中的Javascript代码,找到生成签名的函数方法,进而进行伪造签名,破解反爬虫。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于非对称二次加密的反爬虫方法及系统,将第二次加密的加密函数放在服务器端,使得爬虫工程师无法破解加密参数的生成规则的,从而保护数据。
本发明所采用的第一技术方案是:一种基于非对称二次加密的反爬虫方法,包括以下步骤:
验证用户登录;
基于客户端进行一次加密,生成sign01;
响应于用户访问,调用RPC微服务验证sign01并在验证通过后进行二次加密,生成sign02;
用户基于sign02访问目标服务器,目标服务器验证成功,返回数据。
进一步,所述验证用户登录这一步骤,还包括:
用户提交账号密码登录并把cookies值写到客户端;
记录cookies值。
进一步,所述基于客户端进行一次加密,生成sign01这一步骤,其具体包括:
判断到用户登录成功,客户端基于预设规则通过javascript生成代码,得到sign01参数。
进一步,所述在验证通过后进行二次加密,生成sign02,其具体包括:
将业务请求参数按字母先后顺序排序;
将参数名称和参数值链接成一个字符串A;
在字符串A的尾部加上密钥组成一个新字符串B;
所述密钥存储在服务器端;
对字符串进行MD5散列运算得到API签名sign并构建sign02。
本发明所采用的第二技术方案是:一种基于非对称二次加密的反爬虫系统,包括:
客户端,用于验证用户登录、记录cookies值、生成sign01和调用RPC微服务;
用户端,用于提交用户账号密码、访问服务器和接收返回数据;
服务器端,用于验证sign02并在验证通过后返回数据。
本发明方法及系统的有益效果是:本发明先通过登陆验证初步过滤用户,拒绝非法请求,通过采取二次加密技术,大大增加爬虫的难度,进一步,将第二次加密的加密函数放在服务器端,使得爬虫工程师是无法破解加密参数的生成规则的,从而保护数据。
附图说明
图1是本发明一种基于非对称二次加密的反爬虫方法的步骤流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州南洋理工职业学院,未经广州南洋理工职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110895961.3/2.html,转载请声明来源钻瓜专利网。