[发明专利]基于AI的验证码图片识别方法、装置、设备及存储介质在审
申请号: | 202010615103.4 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111753845A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 胡一川;汪冠春;褚瑞;李玮;刘金艳;唐祥光;胡景超 | 申请(专利权)人: | 北京来也网络科技有限公司;北京奔影网络科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N20/00;G06T5/00;G06T5/40;G06T7/11 |
代理公司: | 北京科领智诚知识产权代理事务所(普通合伙) 11782 | 代理人: | 陈士骞 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai 验证 图片 识别 方法 装置 设备 存储 介质 | ||
1.一种基于AI的验证码图片识别方法,其特征在于,包括:
S1、获取待识别的验证码图片;
S2、将所述待识别的验证码图片输入验证码识别模型中,其中,所述验证码识别模型是通过提取初始验证码特征生成训练数据来对机器学习模型进行训练得到的;
S3、根据所述验证码识别模型的输出字符对所述待识别的验证码图片进行验证。
2.根据权利要求1所述的方法,其特征在于,所述验证码识别模型通过以下步骤获得,包括:
S21、根据预先获得的初始验证码图片,提取初始验证码图片中的图像特征信息,对所述图像特征信息进行处理;获得元素信息,对所述元素信息进行随机组合并添加到图片中,生成新的验证码图片;所述图像特征信息包括验证码的颜色分布信息,所述元素信息包括验证码的背景色、像素噪声分布、字符信息、字体信息;
S22、通过生成的验证码图片以及对应的元素信息训练神经网络模型,得到验证码识别基础模型;
S23、将预先获得的测试验证码输入所述验证码识别基础模型,比较所述验证码识别基础模型的输出与测试验证码的标定字符是否一致,若输出与标定字符不一致,则根据字符之间的差距,更新用于训练所述验证码识别基础模型的验证码图片,以更新验证码识别基础模型的参数;
S24、保存所述验证码识别基础模型,利用标注好的数据对所述验证码识别基础模型进行训练,得到验证码识别模型。
3.根据权利要求2所述的方法,其特征在于,所述根据预先获得的初始验证码图片,提取初始验证码图片中的图像特征信息,对所述图像特征信息进行处理,获得元素信息,对所述元素信息进行随机组合并添加到图片中,生成新的验证码图片的步骤,包括:
S211、对预先获得的初始验证码图片,根据背景色和预设的颜色阈值之间的差异,将字符区域与背景色区分开,从而获得验证码的图像特征信息,所述图像特征信息包括验证码的颜色分布信息;
S212、根据所述颜色分布信息获得验证码的像素噪声分布,删除字符区域的像素点中的噪声点,根据验证码字符之间的空白像素点,将验证码字符分离,获得验证码的字符信息;;
S213、将验证码字符信息输入预先训练的字体识别系统,获得验证码的字体信息;所述字体识别系统根据相似度计算或分类模型输出对应的字体信息;
S214、将背景色、像素噪声分布、字符信息以及字体信息采用随机组合的方式添加到图片中,生成新的验证码图片。
4.根据权利要求2所述的方法,其特征在于,所述通过生成的验证码图片以及对应的元素信息训练神经网络模型,得到验证码识别基础模型的步骤,包括:
S221、根据生成的验证码图片以及每一验证码图片对应的字符信息生成训练样本集,所述训练样本集包含多个训练样本,每个训练样本包含一个验证码图片以及对应的字符信息;
S222、通过所述训练样本集对神经网络模型进行训练,得到所述验证码识别基础模型,所述验证码识别基础模型用于根据输入的验证码图片,输出验证码图片对应的字符信息。
5.根据权利要求2所述的方法,其特征在于,所述将预先获得的测试验证码输入所述验证码识别基础模型,比较所述验证码识别基础模型的输出与测试验证码的标定字符是否一致,若输出与标定字符不一致,则根据字符之间的差距,则更新用于训练所述验证码识别基础模型的验证码图片,以更新验证码识别基础模型的参数的步骤,包括:
S231、将预先获得的测试验证码输入所述验证码识别基础模型,获得所述验证码识别基础模型输出的预测字符;
S232、将所述预测字符与测试验证码的标定字符进行比较,确定所述预测字符与所述标定字符是否一致;
S233、若所述预测字符与所述标定字符不一致,则根据字符之间的差距,更新对所述图像特征信息处理的预设颜色阈值的参数、噪声点的选取个数、字符个数、字体类型中的一个或多个,以生成新的验证码图片更新验证码识别基础模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京来也网络科技有限公司;北京奔影网络科技有限公司,未经北京来也网络科技有限公司;北京奔影网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010615103.4/1.html,转载请声明来源钻瓜专利网。