[发明专利]一种识别验证图片中验证码的方法、装置及电子设备在审

专利信息
申请号: 201910945443.0 申请日: 2019-09-30
公开(公告)号: CN110765442A 公开(公告)日: 2020-02-07
发明(设计)人: 禹庆华;李斌;李国辉;叶盛 申请(专利权)人: 奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司
主分类号: G06F21/36 分类号: G06F21/36;G06N20/00;G06K9/62
代理公司: 11002 北京路浩知识产权代理有限公司 代理人: 苗晓静
地址: 100088 北京市西城区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 验证码 合成 装置及电子设备 验证 表面信息 轮廓信息 全面覆盖 网站验证 形态变化 训练数据 训练样本 图片 捕获 样本
【说明书】:

发明实施例提供了一种识别验证图片中验证码的方法、装置及电子设备,通过对RCN进行训练,得到用于对验证图片中验证码进行识别的模型。对RCN训练的训练样本为合成验证码和第一合成图片。合成验证码和第一合成图片根据网站验证码的特点合成,能够兼顾各种形态的验证码和各种方式的验证码组合。训练数据对各种形态验证码的全面覆盖使得训练的模型能够对各种形态的验证码进行准确的识别。同时,RCN模型本身能够捕获轮廓信息和表面信息,依照被识别物体的形态进行识别,具有很强的泛化能力。因此,通过丰富充足的样本对RCN进行训练得到的第一模型能够准确地识别形态变化各异的验证码。

技术领域

本发明涉及机器学习和计算机视觉技术领域,尤其是涉及一种识别验证图片中验证码的方法、装置及电子设备。

背景技术

通常在登录或者注册网站时,网站会随机生成一个验证码,用户只有将正确的验证码填写到验证的窗口后,才会进行后续的注册或者登录流程。然而,有些情况下需要程序能够自动识别出验证码,例如,当通过网络爬虫从大量的网站获取数据时,需要登录大量的网站。在这种情况下,若人工识别各网站的二维码,则需要花费大量的时间,效率非常低。

目前虽然存在自动识别验证码的技术,但由于验证码中字符的形态变化各异,对识别验证码算法的泛化能力要求很高,而目标识别验证码的算法无法对形态变化各异进行准确识别。

由此,在实际应用过程中,识别验证码的算法泛化能力较弱,无法准确地识别形态变化各异的验证码。

发明内容

本发明实施例提供一种识别验证图片中验证码的方法、装置及电子设备,用以解决现有技术中的现有的识别验证码的算法泛化能力较弱,无法准确地识别形态变化各异的验证码的问题。

针对以上技术问题,第一方面,本发明的实施例提供了一种识别验证图片中验证码的方法,包括:

获取待验证的目标验证图片,去除所述目标验证图片的背景噪音,得到第一验证图片;

将所述第一验证图片输入到第一模型中,得到由所述第一模型根据所述第一验证图片识别得到的目标验证码;

其中,所述第一模型根据合成验证码和第一合成图片,对递归皮质网络RCN进行训练得到,第一合成图片为根据合成验证码生成的,不包括背景噪音的图片。

可选地,所述去除所述目标验证图片的背景噪音,得到第一验证图片,包括:

将所述目标验证图片输入到第二模型中,由所述第二模型去除所述目标验证图片的背景噪音,得到所述第一验证图片;

其中,所述第二模型根据第二合成图片和第一合成图片进行机器学习得到,第二合成图片为根据第一合成图片生成的,包括背景噪音的图片。

可选地,所述第一模型根据合成验证码和第一合成图片,对递归皮质网络RCN进行训练得到,所述第一合成图片为根据合成验证码生成的,不包括背景噪音的图片,包括:

生成合成验证码;其中,合成验证码根据组成欲登录网站或应用程序的验证码中的字符种类和字符数量生成;

生成包括合成验证码,且不包括背景噪音的第一合成图片,并将第一合成图片作为第一训练样本,将与第一合成图片对应的合成验证码作为第一期望输出;

通过若干组第一训练样本和第一期望输出对RCN进行训练,得到所述第一模型。

可选地,所述第二模型根据第二合成图片和第一合成图片进行机器学习得到,第二合成图片为根据第一合成图片生成的,包括背景噪音的图片,包括:

获取生成的第一合成图片,并在第一合成图片上合成包括背景噪音的第二合成图片;

将第二合成图片作为第二训练样本,将第一合成图片作为第二期望输出;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司,未经奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910945443.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top