[发明专利]一种倒置汉字验证码自动识别方法及系统有效
申请号: | 201710599718.0 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107292307B | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 路松峰;罗立志;王同洋 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/36;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 廖盈春;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 倒置 汉字 验证 自动识别 方法 系统 | ||
本发明公开了一种倒置汉字验证码自动识别方法及系统,所述方法包括:对待识别验证码图像进行处理得到目标验证码图像,由目标验证码图像中每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;生成与目标验证码图像对应的标签信息,标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;将标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由倒置汉字自动识别模型将神经元的output个数设置为与标签信息的长度一致;使用交叉熵之和作为已训练的倒置汉字自动识别模型的损失函数,对损失函数进行训练,直至损失函数收敛,输出识别结果。可实现对倒置汉字验证码的自动识别。
技术领域
本发明属于自动识别技术领域,更具体地,涉及一种倒置汉字验证码自动识别方法及系统。
背景技术
随着互联网的高速发展,网络在给人们的生活带来极大便利的同时,其安全问题也日益突出。网络验证码作为一项广泛使用的验证手段,对网络安全起到了重要的作用。
目前,对于字符型验证码的识别主要就是对于文字的识别,主要流程如下:准备原始图片素材;图片预处理,字符切割,图片尺寸归一化;图片字符标记;字符图片特征提取;生成特征和标记对应的训练数据集;训练特征标记数据生成识别模型;使用识别模型预测新的未知图片集。
然而,传统的验证码识别技术是对验证码中出现的字符进行识别,比如数字,字母等。而没有关于如何对倒置中文字符的识别。
发明内容
针对现有技术的以上缺陷或改进需求,本发明的目的在于提供了一种倒置汉字验证码自动识别方法及系统,由此解决传统的验证码识别技术不能识别倒置中文字符的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种倒置汉字验证码自动识别方法,包括:
对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;
使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
优选地,所述已训练的倒置汉字自动识别模型的训练方法为:
对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由所述训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
使用交叉熵之和作为所述训练模型的损失函数,对所述训练模型进行训练,直至所述训练模型的输出正确率满足预设正确率要求,保存所述训练模型。
优选地,所述训练模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710599718.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:目标检测方法及装置
- 下一篇:一种基于神经网络的字符粘连验证码的识别方法