[发明专利]字符验证码识别模型训练方法、识别方法、系统、设备及介质在审

专利信息
申请号: 202011238297.7 申请日: 2020-11-09
公开(公告)号: CN112270325A 公开(公告)日: 2021-01-26
发明(设计)人: 魏小文;何晓力;李可玮;张芸蜻;孙晨阳;黄小云 申请(专利权)人: 携程旅游网络技术(上海)有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06N20/20
代理公司: 上海弼兴律师事务所 31283 代理人: 杨东明;余中燕
地址: 200335*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字符 验证 识别 模型 训练 方法 系统 设备 介质
【说明书】:

发明提供一种字符验证码识别模型训练方法、识别方法、系统、设备及介质,该训练方法包括:建立标准字符类别库,其中包含若干字符及与各字符对应的类别向量;获取若干字符验证码样本图像,并以相应图像中包含的字符命名;通过字符位置预测模型获取各字符验证码样本图像中每个字符的目标位置偏移量;将各字符验证码样本图像的名称中的字符与标准字符类别库中的字符进行匹配,以获取各字符验证码样本图像中的字符的目标类别向量;根据各字符验证码样本图像中每个字符的目标类别向量和目标位置偏移量,对字符验证码识别模型进行训练,得到目标字符验证码识别模型。本发明能够提高字符验证码识别的准确率和效率,同时提高训练样本的生成效率。

技术领域

本发明涉及深度学习领域,尤其涉及一种字符验证码识别模型训练方法、识别方法、系统、设备及介质。

背景技术

验证码是一种区分用户是计算机还是人的公共全自动程序。字符验证码被广泛应用于互联网服务中,作为判断网络请求是否来自合法用户的工具,从而防范机器的大量自动请求,保障网站服务器的稳定运行。字符验证码是目前最常被使用的一类验证码。该类验证码通常需要用户完成一个文字识别任务,用户需要正确识别出由计算机图像技术生成的字符图像中的各个字符以通过验证。为了提高机器识别验证码的难度,该类验证码的图像中通常会伴随有噪点、干扰线等作为干扰。此外,一些验证码采用中文字符作为待识别字符。由于中文字符的笔划较多,线条结构较为复杂,传统图像识别方法难以有效地将字符前景与干扰背景分割开来,导致识别成功率低,耗时长。此外,传统图像识别方法往往依赖大量的标注数据进行训练,每一张图像由人工标注、核验,整个过程费时费力,且耗费大量的资金。

发明内容

针对上述现有技术的不足,本发明的目的在于提供一种字符验证码识别模型训练方法、识别方法、系统、设备及介质,以提高字符验证码识别的准确率和效率,同时提高训练样本的生成效率。

为了实现上述目的,本发明提供一种字符验证码识别模型训练方法,包括:

建立标准字符类别库,所述标准字符类别库中包含若干字符以及与各字符对应的类别向量;

获取若干字符验证码样本图像,各所述字符验证码样本图像以相应图像中包含的字符命名;

通过预先训练的字符位置预测模型获取各所述字符验证码样本图像中每个字符的目标位置偏移量;

将各所述字符验证码样本图像的名称中的字符与所述标准字符类别库中的字符进行匹配,以获取各所述字符验证码样本图像中的字符的目标类别向量;

根据各所述字符验证码样本图像中每个字符的目标类别向量和目标位置偏移量,对字符验证码识别模型进行训练,得到目标字符验证码识别模型。

在本发明一个优选实施例中,所述建立标准字符类别库的步骤包括:

获取若干第一字符验证码图像,各所述第一字符验证码图像以相应图像中包含的字符命名;

对所述若干第一字符验证码图像的名称中包含的字符进行预处理,得到若干目标字符;

根据各所述目标字符以及各目标字符对应的类别向量建立所述标准字符类别库。

在本发明一个优选实施例中,所述对所述若干第一字符验证码图像的名称中包含的字符进行预处理,得到若干目标字符的步骤,包括:

对所述若干第一字符验证码图像的名称中包含的字符进行去重处理;

统计所述若干第一字符验证码图像的名称中包含的各字符出现的频率,并过滤频率低于预定阈值的字符;

将去重和过滤后,所述若干第一字符验证码图像的名称中剩余的字符作为所述目标字符。

在本发明一个优选实施例中,所述字符位置预测模型的训练过程如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游网络技术(上海)有限公司,未经携程旅游网络技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011238297.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top