[发明专利]一种针对复杂背景的文本验证码自动识别方法有效

专利信息
申请号: 202010495757.8 申请日: 2020-06-03
公开(公告)号: CN111652233B 公开(公告)日: 2023-04-25
发明(设计)人: 王瑶;王佰玲;魏玉良;张茗晋;辛国栋;王巍 申请(专利权)人: 哈尔滨工业大学(威海);威海天之卫网络空间安全科技有限公司
主分类号: G06V20/62 分类号: G06V20/62;G06V10/26;G06V10/82;G06V10/30;G06N3/045;G06N3/0475;G06N3/044;G06N3/048;G06N3/082
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 杨磊
地址: 264209 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 复杂 背景 文本 验证 自动识别 方法
【权利要求书】:

1.一种针对复杂背景的文本验证码自动识别方法,包括:

验证码去噪模块通过循环生成式对抗网络去除真实验证码的复杂安全特征;

字符分割模块使用图像处理算法将整体验证码图片分割为单个字符;

分割后的字符送入文本识别网络得到最终输出;

通过循环生成式对抗网络对真实验证码进行去噪过程中,首先利用验证码生成器,通过参数调节,批量生成与真实验证码字体格式类似的图片,并与真实验证码成对组合成训练集,作为去噪网络的输入;所述的循环生成式对抗网络由两个生成器和两个判别器组成,整体呈对偶结构;

所述的图像处理算法采用轮廓检测、改进后的等距分割算法和阈值分割算法,所述的改进的等距分割算法中,分割的起始位置为第一个字符的左上角像素点,分割宽度为每个字符的近似大小,分割高度为每个字符的近似高度;

所述的循环生成式对抗网络进行去噪的优化目标包括两种不同类型的损失函数,分别为对抗性损失和循环一致性损失;其中,对抗性损失用于匹配生成图片的像素分布与目标域中图片的像素分布;循环一致性损失用于控制转换后的图像与源域中图像尽量相似;

真实验证码和生成验证码分别作为域X和域Y,使用两个风格转换器在域X和域Y之间互相转换;优化过程如下:(1)首先利用卷积神经网络对输入图片进行特征提取,得到特征向量;(2)然后通过Resnet模块将域X中图片的特征向量转换为域Y中的特征向量,并且在转换的同时保留原始图像特征的目标;(3)最后,解码过程通过反卷积操作,由特征向量还原出转换后的图像;

针对处理后边缘清晰但字符扭曲的文本验证码,采用轮廓检测的算法进行字符分割;

所述轮廓检测的算法对整个图片像素点进行扫描,找到每个字符外边界的起始点以及孔边界的起始点,并对这些边界点进行编号,最后通过轮廓绘制函数将这些外边界连接起来,得到最终的分割结果;

针对验证码图片中存在的字符大小间距不等的情况,采用阈值分割算法,流程如下:首先对图片进行二值化处理;然后计算图片的纵坐标像素累加值,采用峰谷值分析法来确定阈值大小。

2.根据权利要求1所述的针对复杂背景的文本验证码自动识别方法,其特征在于,所述的文本识别网络为卷积神经网络,包括卷积层、池化层、dropout层以及全连接层。

3.根据权利要求2所述的针对复杂背景的文本验证码自动识别方法,其特征在于,所述卷积神经网络使用ReLu作为激活函数,使用交叉熵作为损失函数,优化器选择Adadelta。

4.根据权利要求1所述的针对复杂背景的文本验证码自动识别方法,其特征在于,针对扭曲旋转幅度大的文本验证码类型,文本识别网络首先使用空间变换层对其进行校正,使模型具有空间不变性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海);威海天之卫网络空间安全科技有限公司,未经哈尔滨工业大学(威海);威海天之卫网络空间安全科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010495757.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top