[发明专利]一种中文字符验证码的识别方法在审
申请号: | 201610117882.9 | 申请日: | 2016-03-02 |
公开(公告)号: | CN105760891A | 公开(公告)日: | 2016-07-13 |
发明(设计)人: | 杨炜祖;李从恺 | 申请(专利权)人: | 上海源庐加佳信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 201208 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 字符 验证 识别 方法 | ||
技术领域
本发明涉及一种字符识别方法,尤其是涉及一种中文字符验证码的识别方法。
背景技术
2003年,XuewenWang等的工作表明,基于Gabor滤波核的特征提取,能有效解决字符识别问题。他们针对样本中字符的宽度、主方向等人工设计了Gabor滤波核,在手写体中文字符识别方面取得了非常好的效果。不过他们的方法需要人工依据样本设计滤波核,对样本集依赖较大,泛化能力不强,所提出的方法不能很好地移植到别的模式的字符识别任务中。
2010年,牛洁利用中值滤波、二值化以及连通域分析等方法对图像预处理,去除噪点,继而通过投影法定位字符,再通过模板匹配的方法识别字符,字符限制在26个英文字母和10个阿拉伯数字之间。该研究最后还开发了一个系统,可通过人工交互选择一些基本的预处理、字符定位方法。
2013年,郑晓飞主要关注验证码识别中,单个字符的识别部分,采用了“伪二维隐马尔科夫模型”对图像进行分类。他指出,模板匹配法需要针对某一种验证码来建立较标准的模板库,这样才会对该类验证码识别率较高,因而适应性不够好,此外其抗形变性能较差;以结构特征为基础的字符结构分析法提前不需要相关的参数知识,只要验证码的结构比较固定;而使用人工智能领域的相关方法,重新训练一定的样本即可对不同的验证码达到较高的识别正确率,具有较强的稳定性和适应性。当前较复杂的验证码字符都具有粘连、形变甚至空心等阻止分割的特点,这一类验证码其破解的关键不是识别,而在于能否准确分割字符。本文针对的验证码字符倾斜、扭曲的程度较大,字体也不是标准字体,这样导致使用传统的模板匹配法和结构分析法很难正确识别出,而隐马尔可夫模型既能描述局部特征,又能表示整体结构,具有一定的抗噪性。
2014年,李凯胜针对不同模式的验证码选择并使用相适合的背景干扰过滤方法、字符分割方法、字符归一化处理方法,之后借助成熟的OCR软件对归一化后的字符进行识别。他的方法需要对不同模式的验证码分别应用不同的方法,且识别效果强烈依赖于预处理之后的效果和所使用的OCR方法,因为如果预处理后的字符图像仍带有杂线,则OCR方法将给出错误结果。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种字符定位准确、适用范围广、识别精度高的中文字符验证码的识别方法。
本发明的目的可以通过以下技术方案来实现:
一种中文字符验证码的识别方法,包括以下步骤:
1)对将待识别图像中的前景像素坐标进行聚类,获取待识别图像中中文字符的位置;
2)对获取中文字符位置后的待识别图像进行切分,获取待识别图像中中文字符的区域,并采用多尺度Gabor滤波核提取区域内中文字符的图像特征;
3)按照步骤1)和2)的方法提取已标注字符标签的训练集图像的图像特征;
4)根据训练集图像的图像特征训练多项式Logistic回归分类器,并采用多项式Logistic回归分类器对中文字符的图像特征进行预测,预测得到的结果即为待识别图像中的中文字符。
所述的步骤1)具体包括以下步骤:
将待识别图像中所有前景像素点的坐标点按待识别图像中中文字符的数量建模为多个二维高斯混合模型,采用最大化似然概率K-means算法对前景像素点坐标进行聚类,得到各个二维高斯混合模型的均值点坐标,这些均值点即为待识别图像中中文字符的位置。
所述的步骤2)中,所述的多尺度Gabor滤波核包括频率、尺度和方向三个参数。
所述的步骤2)中,所述的频率参数f的取值为0.05或0.25,尺度参数sigma的取值为1或3,方向参数的取值为0、或所述的多尺度Gabor滤波核包括16个滤波核。
所述的步骤2)中的图像特征包括16个滤波核分别对图像进行卷积后得到二维矩阵对应的均值和方差。
所述的步骤4)具体包括以下步骤:
41)将提取到的已标注字符标签的训练集图像的图像特征输入多项式Logistic回归分类器中进行训练;
42)采用训练后的多项式Logistic回归分类器对待识别图像区域内中文字符的图像特征进行预测;
43)从预测结果中选择概率最高的向量作为识别结果。
与现有技术相比,本发明具有以下优点:
一、字符定位准确:通过K-means聚类方法对图像上前景点聚类,从而定位字符位置,相较于垂直投影方法更适合解决有相邻字符有少量粘连时的字符定位问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海源庐加佳信息科技有限公司,未经上海源庐加佳信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610117882.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏出力波动类型的划分方法
- 下一篇:一种防盗装置、系统及其方法