[发明专利]用于验证码识别的神经网络模型的构建方法和装置在审
申请号: | 201710453765.4 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107360137A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 张圣洁;秦祎晗;刘奕慧;郭玮 | 申请(专利权)人: | 深圳市牛鼎丰科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 谢曲曲 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 验证 识别 神经网络 模型 构建 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别是涉及一种用于验证码识别的神经网络模型的构建方法、装置、存储介质及计算机设备和一种验证码识别方法、装置、存储介质及计算机设备。
背景技术
验证码是为了防止恶意的自动注册等行为,通过一串随机产生的数字或字母而生成的图片,且图片里通常会加入一些干扰因素,比如说干扰线及字符粘连。用户肉眼识别验证码之后,需正确填写验证码并提交网站验证,验证成功后才能完成相应的操作。在网络爬虫收集数据的运行过程中,经常会遇到需要输入验证码的情况。网络爬虫又被称为网页蜘蛛或网络机器人等,是一种按照一定的规则自动地抓取万维网信息的程序或者脚本。由于人为手动输入验证码效率低下,因此自动识别验证码显得尤为重要。
然而,传统的验证码识别方法容易受验证码中的干扰线以及字符粘连的干扰,且能识别的字符种类存在局限性,从而导致验证码识别率较低。
发明内容
本发明实施例提供一种用于验证码识别的神经网络模型的构建方法、装置、存储介质及计算机设备,可以有效解决验证码识别效率较低的技术问题,使验证码识别更加准确。
本发明实施例还提供一种验证码识别方法、装置、存储介质及计算机设备,可以有效解决验证码识别效率较低的技术问题,使验证码识别更加准确。
一种用于验证码识别的神经网络模型的构建方法,所述方法包括:
获取多个训练验证码,每个训练验证码中包含一个待识别字符;
提取每个所述训练验证码中的字符特征数据;
将所述训练验证码中的字符特征数据导入包含初始的神经网络参数的神经网络模型中进行处理,生成识别字符;
根据每个识别字符与对应训练验证码的验证字符计算所述神经网络模型的识别误差率;
当所述识别误差率大于误差率阈值时,根据所述识别字符与所述训练验证码调整所述神经网络模型的神经网络参数,将调整后的神经网络参数作为初始的神经网络参数,并返回将所述训练验证码中的字符特征数据导入包含初始的神经网络参数的神经网络模型中进行处理,生成识别字符的步骤继续训练,直至所述识别误差率小于误差率阈值;将最后一次调整后的神经网络参数作为所构建的神经网络模型的神经网络参数。
在其中一个实施例中,所述字符特征数据包括每行目标像素点的和以及固定列目标像素点的和,所述目标像素点是所述待识别字符在所对应的训练验证码中占据的像素点;
将所述训练验证码中的字符特征数据导入包含初始的神经网络参数的神经网络模型中进行处理,生成识别字符,包括:
将所述每行目标像素点的和以及固定列目标像素点的和导入包含初始的神经网络参数的神经网络模型中进行处理,生成识别字符。
在其中一个实施例中,所述将所述每行目标像素点的和以及固定列目标像素点的和导入包含初始的神经网络参数的神经网络模型中进行处理,生成识别字符,包括:
将所述每行目标像素点的和以及固定列目标像素点的和生成对应维度的特征向量;
将所述特征向量输入包含初始的神经网络参数的神经网络模型进行处理,生成识别字符。
在其中一个实施例中,所述神经网络模型包括反馈型神经网络模型;所述神经网络参数包括所述反馈型神经网络模型中隐含层节点的个数。
一种验证码识别方法,所述方法包括:
获取待识验证码;
将所述待识别验证码转换成对应数量的单字符验证码,每个单字符验证码中包含一个待识别字符;
提取每个单字符验证码中的字符特征数据;
将所述字符特征数据导入所述用于验证码识别的神经网络模型的构建方法中任一项所构建出的神经网络模型中进行处理,生成所识别出的单个字符;
根据每个单个字符生成所述待识验证码对应的字符。
在其中一个实施例中,所述将所述待识别验证码转换成对应数量的单字符验证码,包括:
将所述待识别验证码通过图像预处理生成二值验证码;
将所述二值验证码分割成对应数量的单字符验证码。
一种用于验证码识别的神经网络模型的构建装置,所述装置包括:
训练验证码获取模块,用于获取多个训练验证码,每个训练验证码中包含一个待识别字符;
字符特征数据提取模块,用于提取每个所述训练验证码中的字符特征数据;
识别字符生成模块,用于将所述训练验证码中的字符特征数据导入包含初始的神经网络参数的神经网络模型中进行处理,生成识别字符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市牛鼎丰科技有限公司,未经深圳市牛鼎丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710453765.4/2.html,转载请声明来源钻瓜专利网。