[发明专利]一种倒置汉字验证码自动识别方法及系统有效
申请号: | 201710599718.0 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107292307B | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 路松峰;罗立志;王同洋 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/36;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 廖盈春;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 倒置 汉字 验证 自动识别 方法 系统 | ||
1.一种倒置汉字验证码自动识别方法,其特征在于,包括:
对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;所述倒置汉字自动识别模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层;
使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
2.根据权利要求1所述的方法,其特征在于,所述已训练的倒置汉字自动识别模型的训练方法为:
对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由所述训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
使用交叉熵之和作为所述训练模型的损失函数,对所述训练模型进行训练,直至所述训练模型的输出正确率满足预设正确率要求,保存所述训练模型。
3.根据权利要求2所述的方法,其特征在于,所述2维卷积神经网络模型的参数为,输入为验证码图像中的字符个数,卷积核数量为M,对每个输入提取M维特征,卷积核的大小为N*N,channel值为L,边界处理方式padding值为SAME,池化函数采用平均池化avg_pool,使用C*C池化,将C*C的色块降为边界处理方式padding值为SAME。
4.根据权利要求3所述的方法,其特征在于,M取值为32,N取值为5,L取值为1,C取值为2。
5.一种倒置汉字验证码自动识别系统,其特征在于,包括:
字符分割模块,用于对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
标签信息生成模块,用于生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
输入模块,用于将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;所述倒置汉字自动识别模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层;
识别模块,用于使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710599718.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:目标检测方法及装置
- 下一篇:一种基于神经网络的字符粘连验证码的识别方法