[发明专利]一种中文字符验证码的识别方法在审
申请号: | 201610117882.9 | 申请日: | 2016-03-02 |
公开(公告)号: | CN105760891A | 公开(公告)日: | 2016-07-13 |
发明(设计)人: | 杨炜祖;李从恺 | 申请(专利权)人: | 上海源庐加佳信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 201208 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 字符 验证 识别 方法 | ||
1.一种中文字符验证码的识别方法,其特征在于,包括以下步骤:
1)对将待识别图像中的前景像素坐标进行聚类,获取待识别图像中中文字符的位置;
2)对获取中文字符位置后的待识别图像进行切分,获取待识别图像中中文字符的区域,并采用多尺度Gabor滤波核提取区域内中文字符的图像特征;
3)按照步骤1)和2)的方法提取已标注字符标签的训练集图像的图像特征;
4)根据训练集图像的图像特征训练多项式Logistic回归分类器,并采用多项式Logistic回归分类器对中文字符的图像特征进行预测,预测得到的结果即为待识别图像中的中文字符。
2.根据权利要求1所述的一种中文字符验证码的识别方法,其特征在于,所述的步骤1)具体包括以下步骤:
将待识别图像中所有前景像素点的坐标点按待识别图像中中文字符的数量建模为多个二维高斯混合模型,采用最大化似然概率K-means算法对前景像素点坐标进行聚类,得到各个二维高斯混合模型的均值点坐标,这些均值点即为待识别图像中中文字符的位置。
3.根据权利要求1所述的一种中文字符验证码的识别方法,其特征在于,所述的步骤2)中,所述的多尺度Gabor滤波核包括频率、尺度和方向三个参数。
4.根据权利要求3所述的一种中文字符验证码的识别方法,其特征在于,所述的步骤2)中,所述的频率参数f的取值为0.05或0.25,尺度参数sigma的取值为1或3,方向参数的取值为0、或所述的多尺度Gabor滤波核包括16个滤波核。
5.根据权利要求4所述的一种中文字符验证码的识别方法,其特征在于,所述的步骤2)中的图像特征包括16个滤波核分别对图像进行卷积后得到二维矩阵对应的均值和方差。
6.根据权利要求1所述的一种中文字符验证码的识别方法,其特征在于,所述的步骤4)具体包括以下步骤:
41)将提取到的已标注字符标签的训练集图像的图像特征输入多项式Logistic回归分类器中进行训练;
42)采用训练后的多项式Logistic回归分类器对待识别图像区域内中文字符的图像特征进行预测;
43)从预测结果中选择概率最高的向量作为识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海源庐加佳信息科技有限公司,未经上海源庐加佳信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610117882.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏出力波动类型的划分方法
- 下一篇:一种防盗装置、系统及其方法