[发明专利]一种破解滑块验证码的方法及装置在审
申请号: | 201810745453.5 | 申请日: | 2018-07-09 |
公开(公告)号: | CN108920931A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 仇越 | 申请(专利权)人: | 山东汇贸电子口岸有限公司 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06F3/0486 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 高经 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 验证码 滑块 破解 数据采集效率 图像处理算法 阴影 工作效率 位移距离 大数据 图片 | ||
本发明公开了一种破解滑块验证码的方法及装置,属于大数据技术领域。本发明的破解滑块验证码的方法,通过selenium获取滑块验证码原图和带阴影块的图片,通过图像处理算法算出滑块验证码原图和带阴影块的图片之间的位移距离,来破解滑块验证码。该发明的破解滑块验证码的方法能够大大的提高数据采集效率,增加工作人员工作效率,具有很好的推广应用价值。
技术领域
本发明涉及大数据技术领域,具体提供一种破解滑块验证码的方法及装置。
背景技术
随着大数据时代的到来,数据的影响力逐渐扩大,越来越多的企业需要大数据来支撑自身的业务发展。大数据产业离不开海量数据的支撑,但是在大数据时代,数据壁垒的存在使得海量数据的获取成为从业者的一大难点。
现有技术中,数据的来源主要依靠网络数据采集或是数据库的采集。其中,网络数据采集主要依靠网络爬虫或是公开的api(Application Programming Interface即应用程序编程接口)来获取数据。在网络爬虫的过程中,有的爬虫的目标网站会采用验证码的方式来进行反爬。滑块验证码是现在各大网站和app常用的一种保证用户信息安全,确保是本人操作,并防止黑客恶意攻击造成服务器压力过大的安全服务措施。具有操作简单,对服务器压力小等优点,成为现在很多网站首选。对于数据采集人员来说,数据采集的过程中不可避免的会遇到使用滑块验证码的采集目标,而滑块验证码的存在会大大影响数据采集的效率。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种能够大大的提高数据采集效率,增加工作人员工作效率的破解滑块验证码的方法。
本发明进一步的技术任务是提供一种破解滑块验证码的装置。
为实现上述目的,本发明提供了如下技术方案:
一种破解滑块验证码的方法,该方法通过selenium获取滑块验证码原图和带阴影块的图片,通过图像处理算法计算出滑块验证码原图和带阴影块的图片之间的位移,滑动滑块到计算出的位移处,破解滑块验证码。
Selenium为浏览器自动化测试框架。
所述图像处理算法能够找到出两张相似图片之间差异像素点,并能计算出从左向右扫描第一处差异像素点之间的横坐标位移。
作为优选,具体包括以下步骤:
S1:利用selenium获取滑块验证码原图和带阴影块的图片;
S2:通过图像处理算法算出滑块验证码原图和带阴影块的图片之间的位移;
S3:滑动滑块到计算出来的位移处,破解滑块验证码。
作为优选,步骤S1中,获取滑块验证码原图和带阴影块的图片时,若能获取到滑块验证码原图和带阴影块的图片的链接,并能在浏览器中打开,则直接在浏览器中打开图片链接,截图即可。
作为优选,步骤S1中,获取滑块验证码原图和带阴影块的图片时,若不能获取到滑块验证码原图和带阴影块的图片的链接,则从验证码中获取截图。
作为优选,滑块验证码原图的获取通过元素的坐标、计算出的滑块验证码原图的高度和宽度进行获取;带阴影块的图片先点击滑块,再按滑块验证码原图的截取方式截取带阴影块的图片。
作为优选,步骤S2中,比较获取滑块验证码原图和带阴影块的图片的像素点,得到两个像素点的X值,即为滑块验证码原图和带阴影块的图片之间的位移。
所述X值为横坐标轴上,从一个点到另一个点的距离。
作为优选,步骤S3中,利用selenium模拟鼠标点击滑块,滑动滑块到计算出来的位移处。
将位移距离分成一段一段的小轨迹,然后模拟人的行为习惯,先快后慢,最终验证。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东汇贸电子口岸有限公司,未经山东汇贸电子口岸有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810745453.5/2.html,转载请声明来源钻瓜专利网。