[发明专利]一种端到端的空心验证码识别方法在审
申请号: | 201810193965.5 | 申请日: | 2018-03-05 |
公开(公告)号: | CN110232375A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 朴昌浩;邵慧爽;林松 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06K9/72;H04L29/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065 重庆*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 验证码 预处理 卷积神经网络 粘连 标签 扭曲 背景干扰 图像干扰 有效字符 字符分割 识别率 去除 保留 | ||
本发明发明了一种端到端的空心验证码识别方法,步骤为:A、对扭曲粘连的空心验证码进行预处理,去干扰,获得只含有字符的实心验证码;B、设计卷积神经网络模型,训练预处理后已知标签的整张黑白验证码的模型;C、利用步骤B的卷积神经网络模型,对未知标签的验证码进行识别。本发明提供的技术方案简单实用,能及时的对背景有图像干扰的空心验证码进行预处理,去除背景干扰,保留验证码的有效字符。本技术方案不涉及字符分割,对扭曲粘连的验证码有较高的识别率,增加了验证码识别的统一性。
技术领域
本发明涉及图像识别领域,具体涉及一种端到端的空心验证码识别方法。
背景技术
验证码(CAPTCHA)是一种用来防止恶意程序在互联网上滥用资源的安全机制。被广泛应用于互联网注册、登录和验证等环节,以保证网站稳定性和安全性。一个良好的验证码应具备健壮性和良好的用户体验,人类识别率达到80%,而机器识别率1%。文本型的空心验证码作为一种目前广泛应用的验证码,常由扭曲粘连的数字或英文字母的轮廓线组成。相对早先的实心字符,含有少量的字符特征信息,被应用于各大互联网公司。
目前对于验证码识别的研究,主要包括三部分,即预处理、字符分割、识别。扭曲粘连的空心验证码增加了去干扰和分割的难度,且目前没有统一的字符分割技术。为此,本发明提出了一种无需对验证码进行分割的识别方法,即一种端到端的空心验证码识别方法。
发明内容
针对以上技术背景中的问题,本发明提出无需对验证码进行字符分割的识别方法,即一种端到端的空心验证码识别方法。
进一步技术方案如下:
本发明提供了一种端到端的空心验证码识别方法。该方法主要包括:对空心验证码进行预处理,去干扰,获得只含有字符的实心验证码;设计卷积神经网络模型,训练预处理后已知标签的整张黑白验证码的模型。利用获得的训练模型,对未知标签的验证码进行识别。
所述对空心验证码进行预处理,去干扰,获得只含有字符的实心验证码部分,首先对验证码进行灰度化、二值化。对空心验证码中出现轮廓线断裂的字符,进行断点查找、匹配和连接。接着,对验证码四边相邻的所有封闭区域进行颜色填充,填充为黑色。对剩余的区域按照灰度值依次增加20的顺序规律,使用种子填充算法对连通域填充,此时干扰图案变成了干扰块。根据颜色块中像素点个数小于阀值以及根据颜色块长宽比特性去除部分干扰块。判断剩余颜色块的字符特性,对发生粘连的有效字符颜色块连接成为同一个字符。而对于非粘连的颜色块,根据有效字符块的边界灰度值相邻大小相差20的规律,连接相邻颜色块后再判断字符特性,如果是有效字符,处理成为同一个字符,如不是有效字符,保留其原来形状。
所述对设计卷积神经网络模型,训练预处理后已知标签的整张黑白验证码的模型,设计卷积神经网络的层数、卷积核大小。将预处理后已知标签的整张黑白验证码作为训练集,进行训练,调整参数,获取其中最优的卷积神经网络的模型参数。
所述的用获得的训练模型,对未知标签的验证码进行识别部分。首先将未知标签的验证码进行预处理,去干扰,获得实心的黑白验证码。随后,将此验证码输入到卷积神经网络模型,对整张验证码进行识别。
本发明能够达到的有益效果如下:
(1)预处理能有效去除背景中的干扰图案和干扰线,且去干扰中不会产生对有效字符的破坏。空心字符转换为实心字符,能有效的增加字符信息。
(2)使用卷积神经网络模型对整张验证码进行训练,不需要分割,降低了因字符分割而影响识别的结果,提高了对扭曲粘连的空心验证码的识别率。
附图说明
图1为本发明端到端的空心验证码识别方法的流程图;
图2为本发明实施例验证码原始图片;
图3为本发明实施例预处理后的验证码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810193965.5/2.html,转载请声明来源钻瓜专利网。