[发明专利]一种字符扭曲粘连的图形验证码识别方法有效
申请号: | 201510756878.2 | 申请日: | 2015-11-09 |
公开(公告)号: | CN105426890B | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 成都数之联科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 610041 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 扭曲 粘连 图形 验证 识别 方法 | ||
本发明公开了一种针对字符扭曲粘连的图形验证码识别方法,首先获取一定量的验证码图片以准备模板字符集,然后将待识别的验证码图片进行二值化以后用模板字符集中的每张字符图片在待识别的验证码图片上滑动,找出相似度最高的K张模板字符,并记录这K个字符最相似时所对应的位置,然后按照相同的识别方法从所记录的位置开始继续进行验证码图片剩下部分的识别。最后计算匹配的模板字符图片与整个验证码图片的相似度。最终将得到相似度最高的匹配方式作为验证码识别的最终结果。
技术领域
本发明属于图像识别技术领域,更为具体地讲,涉及一种字符扭曲粘连的图形验证码识别方法。
背景技术
验证码(CAPTCHA)是“Completely Automated Public Turing test to tellComputers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。研究验证码识别技术则是人工智能的范畴,通过对验证码识别技术的研究,使机器能够达到人眼的识别效果,这对于人工智能的发展具有很大的推动作用。同时从事大数据分析的科研机构和科研人员需要获取网上大量的数据以进行科学研究,然而验证码的存在阻碍了数据的顺利获取,验证码识别技术的发展有利于摆脱这种困境,从而推动大数据分析相关技术的发展。
验证码的种类比较多,主要有基于图像模式,基于文本模式和基于语音模式三种。而最广泛使用的是基于文本模式的验证码。它通过对验证码中的文本字符进行扭曲,变形以及增加噪音来阻止验证码中的文本内容被机器人程序通过模式识别的方式进行识别。基于文本模式的验证码最初只由包含简单的数字的图片组成。文本中的字符没有扭曲变形等,字符没有背景图片和噪音。但是这种验证码没有存在多久就被机器人程序自动识别。自从验证码出现,识别技术和反识别技术就竞相竞赛。一方面,由于识别技术发展,推动验证码越来越复杂,以至于出现人眼难以识别的验证码。另一方面,出于各方面的需求,验证码的识别技术也越来越成熟,成为了推动图形学和图像处理技术发展的一股重要的力量。
验证码识别的瓶颈在于字符的分割,随着手写体识别技术的不断发展,很多算法对于单字符识别准确度都达到了90%以上,我们知道手写体的扭曲有很大的随机性,这和验证码如出一辙,所以这些技术可以直接用于验证码单字符的识别,单字符识别算法中,比较成熟且准确率较高的有BP神经网络,卷积神经网络,支持向量机等。如果我们能找到一种算法将相互粘连的字符准确的分开,则验证码识别准确率将得到质的提升。但遗憾的是,至今没能找到一种通用的算法可以将粘连的字符准确分开,多年来研究人员提出了很多字符分割算法,比如颜色填充法,投影直方图分割法,基于背景的细化算法,滴水算法。但效果都不理想。
发明内容
本发明的目的就为了解决字符粘连的验证码识别。由于字符切割的效果不好,我们提出一种基于滑动窗口的验证码识别算法。
本发明的验证码识别算法,包括以下步骤:
1.获取一定量的验证码图片,人工将这些验证码图片中的单个字符分割出来(识别的时候不需要分割),并放入文件夹,相同的字符放入相同的文件夹,文件夹以字符的名字命名。这样便得到了模板字符集。
2.对于待识别的验证码,首先将其转换为灰度图,并除去图片边缘空白的部分,然后用大津算法提取图片的前景,并将图片像素二值化。
3.假设验证码中有N个字符,我们先从左右向识别前个字符,首先识别第一个字符,方法是遍历每种字符的模板字符集,让每张模板字符图片在待识别验证码图片上的一定范围内滑动,每滑动一个位置,计算模板图片与滑动窗口区域的相似度。找出相似度最高时对应的模板图片,并记录第一个字符匹配每类字符时相似度的最大值及对应的滑动窗口的位置。将各类字符相似度的最大值进行排序,取出相似度最高的前K种匹配,并将这K种匹配的匹配状态记录下来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数之联科技有限公司,未经成都数之联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510756878.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像识别的背景过滤方法
- 下一篇:多模态生物识别装置及其进行图像传输的方法