[发明专利]基于深度学习的网络验证码识别方法、装置及计算机设备在审
申请号: | 201911179062.2 | 申请日: | 2019-11-26 |
公开(公告)号: | CN110909807A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 邱富根;王彪;刘龙辉;赵海诚 | 申请(专利权)人: | 深圳市信联征信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 巫苑明 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 网络 验证 识别 方法 装置 计算机 设备 | ||
1.一种基于深度学习的网络验证码识别方法,其特征在于,包括以下步骤:
获取待识别验证码数据;
将待识别验证码数据输入至验证码识别模型内进行文字识别,以得到识别结果;
判断识别结果是否正确;
若识别结果为正确,则自动标注对应的验证码数据进入训练集与测试集;
若识别结果不正确,则重新标注验证码数据;
将自动标注的验证码数据与重新标注的验证码数据放入验证码识别模型进行重新训练,以更新验证码识别模型,直到验证码识别模型的识别率达到预设阈值后停止;
所述验证码识别模型是通过带标识的验证码数据作为样本数据训练卷积神经网络所得的。
2.根据权利要求1所述的基于深度学习的网络验证码识别方法,其特征在于,所述验证码识别模型是通过带标识的验证码数据作为样本数据训练卷积神经网络所得的,包括:
获取网站的部分验证码数据作为验证码样本;
将验证码样本输入已有的卷积神经网络内进行训练,以得到样本输出结果;
将样本输出结果以及带标识的图像数据输入损失函数内,以得到损失值;
根据损失值调整卷积神经网络的参数;
利用样本数据且采用深度学习框架对卷积神经网络进行学习,以得到验证码识别模型。
3.根据权利要求2所述的基于深度学习的网络验证码识别方法,其特征在于,所述获取网站的部分验证码数据作为验证码样本的步骤,包括:
爬取网站部分验证码数据作为验证码样本;
对验证码样本的图片进行预处理;
对验证码样本进行标注,切分训练集与测试集。
4.根据权利要求3所述的基于深度学习的网络验证码识别方法,其特征在于,所述对验证码样本的图片进行预处理缩放的步骤,包括:
对验证码样本的图片进行缩放,降噪,二值化以及归一化预处理。
5.根据权利要求1所述的基于深度学习的网络验证码识别方法,其特征在于,所述判断识别结果是否正确的步骤,包括:
将识别结果提交到网站,接收网站的返回状态;
根据返回状态对识别结果进行判断。
6.一种基于深度学习的网络验证码识别装置,其特征在于,包括:
数据获取单元,用于获取待识别验证码数据;
识别单元,用于将待识别验证码数据输入至验证码识别模型内进行文字识别,以得到识别结果;
结果判断单元,用于判断识别结果是否正确;
标注单元,用于在识别结果为正确时,自动标注对应的验证码数据进入训练集与测试集;在识别结果不正确时,重新标注验证码数据;
重新训练单元,用于将自动标注的验证码数据与重新标注的验证码数据放入验证码识别模型进行重新训练,以得到新的验证码识别模型,使用新模型重复上述步骤,直到验证码识别模型的识别率达到预期阈值后停止。
7.根据权利要求6所述的基于深度学习的网络验证码识别装置,其特征在于,还包括模型训练单元,所述模型训练单元包括:
数据获取子单元,用于获取网站的部分验证码数据作为验证码样本;
样本训练子单元,用于将验证码样本输入已有的卷积神经网络内进行训练,以得到样本输出结果;
损失值获取子单元,用于将样本输出结果以及带标识的图像数据输入损失函数内,以得到损失值;
调参子单元,用于根据损失值调整卷积神经网络的参数;
学习子单元,用于利用样本数据且采用深度学习框架对卷积神经网络进行学习,以得到验证码识别模型。
8.根据权利要求7所述的基于深度学习的网络验证码识别装置,其特征在于,所述数据获取子单元包括数据爬取模块,样本标注模块和预处理模块;
所述数据爬取模块,用于爬取网站部分验证码数据作为验证码样本;
所述预处理模块,用于对验证码样本的图片进行预处理;
所述样本标注模块,用于对验证码样本进行标注,切分训练集与测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市信联征信有限公司,未经深圳市信联征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911179062.2/1.html,转载请声明来源钻瓜专利网。