[发明专利]一种基于深度学习的图形验证码识别方法有效
申请号: | 201910301765.1 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110009057B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 王海舟;杨振宇;顾艾婧;黄港;傅瑞华;王奇 | 申请(专利权)人: | 四川大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都禾创知家知识产权代理有限公司 51284 | 代理人: | 刘凯;裴娟 |
地址: | 610064 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图形 验证 识别 方法 | ||
1.一种基于深度学习的图形验证码识别方法,其特征在于,包括以下步骤:
S1、通过网络爬虫获取若干待识别的真实图形验证码,并对其进行预处理后组成真实验证码数据集;
S2、基于真实验证码数据集训练生成式对抗网络并生成有标注信息的模拟验证码数据集;
S3、选取图形验证码识别网络,并利用模拟验证码数据集对其进行训练;
S4、通过真实验证码数据集和模拟验证码数据集对训练好的图像验证码识别网络进行验证和测试,得到优化后的图形验证码识别网络,实现图形验证码的识别;
所述步骤S2具体为:
S21、构建生成式对抗网络;
S22、基于真实验证码数据集中图形验证码,生成输入到生成式对抗网络中的模拟图形样本;
S23、将生成的模拟图形样本输入到生成式对抗网络中并对其进行训练,完成训练后得到带有标注信息的模拟验证码数据集;
所述步骤S21中的生成式对抗网络包括依次连接的生成子网络和判别子网络;
所述生成子网络为ResNet结构,用于生成类似于模拟图形样本的模拟验证码并输入判别网络;
所述判别子网络为二分类的卷积神经网络结构,用于将输入其中的真实验证码和模拟验证码进行区分;
所述步骤S22中生成模拟图形样本的方法具体为:
A1、根据真实验证码数据集中图形验证码的特性,确定用于生成模拟验证码的字体库;
A2、在确定的字体库的范围内,根据图片生成器Ori_gen生成与真实图形验证码匹配的模拟图形样本;
其中,模拟图形样本与真实图形验证码具有相同的字符数量和分辨率;
所述步骤S23中,对生成式对抗网络进行训练时:
对于生成子网络的训练,先通过真实验证码数据集中的图形验证码对生成子网络进行训练,使其在像素级上进行生成数据的修改;
对于判别子网络的训练,每一轮都添加前五轮的生成样本,并采用PatchGAN思想,将输入图像划分为多个Patch进行识别。
2.根据权利要求1所述的基于深度学习的图形验证码识别方法,其特征在于,所述步骤S1中的对获取的待识别的真实图形验证码预处理包括依次去除图形验证码中的背景、干扰线、噪点和字符粘连。
3.根据权利要求1所示的基于深度学习的图形验证码识别方法,其特征在于,所述步骤S21中,生成式对抗网络中生成子网络中的损失函数为:
式中,Rloss(·)为将生成的模拟数据样本误判为真实数据的损失值;
Yreals为输入的真实样本;
Ploss为生成子网络自训练时的损失值;
判别子网络中的损失函数为:
式中,Ygens为生成子网络生成的模拟数据样本;
D(·)为输入值(·)对应概率值;
判别子网络将生成的模拟数据样本误判为真实数据的损失函数为:
4.根据权利要求1所述的基于深度学习的图形验证码识别方法,其特征在于,所述步骤S23中,对生成式对抗网络进行训练时生成子网络自训练的损失函数为:
Ploss=λ(Ychange-Yori)2
式中,λ为影响因子;
Ychange为在像素级别对生成的图片进行修改后样本;
Yori为初步的穆尼数据样本。
5.根据权利要求1所述的基于深度学习的图形验证码识别方法,其特征在于,所述步骤S3中的图形验证码识别网络为LeNet结构神经网络、AlexNet结构神经网络或LSTM结构神经网络。
6.根据权利要求1所述的基于深度学习的图形验证码识别方法,其特征在于,所述步骤S4具体为:
B1、选取验证集输入到训练好的图形验证码识别网络中,对图形验证码识别网络的网络参数进行优化;
B2、将测试集输入到优化后的图形验证码识别网络,实现图形验证码的识别;
其中,验证集中的数据包括人工标注的真实验证码数据集中的部分验证码数据和模拟验证码数据集中的部分验证码数据;
测试集中的数据为未人工标注的真实验证码数据集中的验证码数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910301765.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种社交账号的分类方法及分类装置
- 下一篇:一种停车场车牌识别系统及方法