[发明专利]破解汉字验证码的方法、系统、电子设备及存储介质在审
申请号: | 201911364218.4 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111160369A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 黄小云;孙晨阳;李可玮;何晓力;魏小文;张芸蜻;谢毅刚 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06F40/151;G06F40/149;G06N3/04;G06N3/08;G06F21/36 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;林嵩 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 破解 汉字 验证 方法 系统 电子设备 存储 介质 | ||
本发明公开了一种破解汉字验证码的方法、系统、电子设备及存储介质,包括步骤:获取目标图像中每个汉字的目标位置;获取所述目标位置中的目标汉字轮廓;根据每个所述目标汉字轮廓获取对应的目标汉字;获取参考图像中的参考汉字轮廓;根据每个所述参考汉字轮廓获取对应的参考汉字和每个所述参考汉字在设定方向上的执行顺序;根据所述执行顺序和所述参考汉字获取所述目标图像中的所述目标汉字对应的点选结果。本发明的破解汉字验证码的方法能够快速有效地确定旋转汉字的点选位置以及点选的顺序,进而通过模拟点击来破解该汉字验证码。
技术领域
本发明属于验证码识别技术领域,具体涉及一种破解汉字验证码的方法、系统、电子设备及存储介质。
背景技术
图形验证码(CAPTCHA)在互联网中的应用十分普遍,无论是账户登录、信息检索、资料下载,甚至是用户在登录后进行某些功能的频繁操作,为了保证操作安全性,网站或客户端程序一般都会要求用户输入验证码来进行下一步操作。图形验证码的形式多种多样,目前常见的有汉字识别式、字符识别(中、英文)式、滑块拼图式、选词式、场景识别式等,其中汉字验证码是应用范围最广的验证码形式之一。目前,一般只能实现对字符验证码的破解;但是,无法有效地实现对汉字验证码的验证。
发明内容
本发明要解决的技术问题是为了克服现有技术中无法对汉字验证码进行有效识别的缺陷,提供一种破解汉字验证码的方法、系统、电子设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种破解汉字验证码的方法,所述方法包括:
获取目标图像中每个汉字的目标位置;
获取所述目标位置中的目标汉字轮廓;
根据每个所述目标汉字轮廓获取对应的目标汉字;
获取参考图像中的参考汉字轮廓;
根据每个所述参考汉字轮廓获取对应的参考汉字和每个所述参考汉字在设定方向上的执行顺序;
根据所述执行顺序和所述参考汉字获取所述目标图像中的所述目标汉字对应的点选结果。
较佳地,所述获取所述目标位置中的目标汉字轮廓的步骤包括:
采用灰度处理方法去除所述目标位置中汉字的图像背景得到第一图像;
对所述第一图像中的噪点进行去除处理得到第二图像;
对所述第二图像中的所述目标位置的汉字进行联通处理得到所述目标汉字轮廓。
较佳地,所述根据每个所述目标汉字轮廓获取对应的目标汉字的步骤包括:
将同一训练汉字的不同旋转角度的汉字图像作为输入,所述训练汉字作为输出,建立用于预测图像中汉字的目标模型;
将所述目标汉字轮廓输入所述目标模型,获取所述目标汉字;
所述根据每个所述参考汉字轮廓获取对应的参考汉字的步骤包括:
将所述参考汉字轮廓输入到所述目标模型,获取所述参考汉字。
较佳地,所述将所述目标汉字轮廓输入所述目标模型,获取所述目标汉字的步骤包括:
每个所述目标汉字轮廓输入到所述目标模型得到多个第一汉字;
其中,每个所述第一汉字对应不同的概率值;
选取所述概率值最高的所述第一汉字作为所述目标汉字;和/或,
所述目标模型为卷积神经网络模型;和/或,
所述获取目标图像中每个汉字的目标位置的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911364218.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无痕滚轮及其制作方法
- 下一篇:一种用于电子设备的启动方法及装置