[发明专利]一种验证码识别方法及装置在审
申请号: | 201711466525.4 | 申请日: | 2017-12-28 |
公开(公告)号: | CN109977980A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 苏斌;王永宝;范宜强 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 验证码 卷积 特征信息 图像 权重 验证码字符 图像输入 样本图像 终端设备 规范化 破解 预设 | ||
本发明实施例提供一种验证码识别方法及装置,用于解决终端设备在识别破解验证码时存在识别效率较低的技术问题。该方法包括:将具有标记的样本图像输入卷积神经网络模型,对卷积神经网络模型进行训练,其中,所述卷积神经网络模型中包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层,且训练后的卷积神经网络模型中卷积的权重数量小于等于标准卷积神经网络模型中卷积的权重数量,提取的图像的特征信息的特征值处于预设范围内;将待识别的验证码图像输入训练后的卷积神经网络模型,获得待识别的验证码图像的识别结果,识别结果用于指示验证码图像中包括的至少一个验证码字符。
技术领域
本发明涉及计算机技术领域,特别涉及一种验证码识别方法及装置。
背景技术
验证码(CAPTCHA)是“Completely Automated Public Turing test to tellComputers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序,目前带有大小写字母和数字的验证码广泛用于各大网站,用来防止机器自动批量注册和反复登录与灌水,字母和数字本身扭曲并带有很多噪声和横线。
验证码概念随着互联网技术的快速发展和应用,网络在给人们提供丰富资源和极大便利的同时,伴随而来的就是互联网系统的安全性问题。验证码的出现,正是加强web系统安全的产物。
现有技术中针对验证码识别破解的方式包括:
第一种:基于图像处理方式,通过预处理(二值化,CFS,连通域),检测(找出文字所在的主要区域),前处理(对图片内容做一些旋转,扭曲,分割等),最后再通过模式识别或机器学习算法来训练,输出成分类器的置信度来判断可能属于哪个字母或数字。
当该方式的技术难点主要在于验证码图片的分割方面,对于识别的匹配,OCR技术已经很成熟了,完全可用于验证码图片的识别,但是复杂的验证码图片大多粘连,分割处理比较麻烦。
第二种:基于深度学习的方式,即通过经典的图片识别网络模型来识别分类验证码图片中的内容。但由于经典的图片识别网络结构过大,需要计算资源较多,且需要大量的标注样本,收敛速度很慢,难以在有限时间内应用。
由此可见,现有技术中终端设备在识别破解验证码时存在识别效率较低的技术问题。
发明内容
本发明实施例提供一种验证码识别方法及装置,用于解决现有技术中的终端设备在识别破解验证码时存在识别效率较低的技术问题。
第一方面,本发明实施例提供一种验证码识别方法,包括以下步骤:
将具有标记的样本图像输入卷积神经网络模型,对所述卷积神经网络模型进行训练;所述卷积神经网络模型中包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层,且训练后的卷积神经网络模型中卷积的权重数量小于等于标准卷积神经网络模型中卷积的权重数量,提取的图像的特征信息的特征值处于预设范围内;
将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,所述识别结果用于指示所述验证码图像中包括的至少一个验证码字符。
可选的,将具有标记的样本图像输入卷积神经网络模型,对所述卷积神经网络模型进行训练,包括:
按照训练规定样本数量将具有标记的样本图像分批输入卷积神经网络模型进行训练;
确定训练次数达到预设次数,计算每批次样本图像的平均损失率和正确率,所述正确率用于表征预测值与标注值相匹配的概率,所述损失率用于表征样本识别失败的数量;
确定所述正确率高于设定值,记录所述卷积神经网络模型当前的训练参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711466525.4/2.html,转载请声明来源钻瓜专利网。