[发明专利]字符识别模型的训练方法、字符识别方法及装置在审
申请号: | 202110369780.7 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113011410A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 史晓东;白杰;施耀一;张赵晨子 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 模型 训练 方法 装置 | ||
本公开提供了一种字符识别模型的训练方法,应用于人工智能领域、金融领域或其他领域。字符识别模型的训练方法包括获取训练样本数据集,其中,训练样本数据集中的训练样本包括卡图像以及卡图像的标签信息,其中,卡图像包括字符;以及利用训练样本数据集训练待训练的字符识别模型,得到字符识别模型,待训练的字符识别模型是通过将基于注意力模块的卷积神经网络以及基于注意力模块的循环神经网络依次级联而构建得到的。本公开还提供了一种字符识别方法、字符识别装置、字符识别模型的训练装置、电子设备、计算机可读存储介质及计算机程序产品。
技术领域
本公开涉及人工智能领域、金融领域或其他领域,更具体地,涉及一种字符识别模型的训练方法、字符识别方法及装置、电子设备、计算机可读存储介质以及计算机程序产品。
背景技术
随着电子商务的兴起,银行卡的使用人群越来越广,而在银行业务中,对银行卡号的录入场景十分常见,然而繁琐的录入银行卡号容易出错,而且效率低,用户体验感很差,因此基于图像识别的银行卡识别技术很有业务价值。
在实现本公开构思的过程中,发明人发现相关技术中存在识别准确率低的问题。
发明内容
有鉴于此,本公开提供了一种字符识别模型的训练方法、字符识别方法及装置。
本公开的一个方面提供了一种字符识别模型的训练方法,包括:
取训练样本数据集,其中,上述训练样本数据集中的训练样本包括卡图像以及上述卡图像的标签信息,其中,上述卡图像包括字符;以及
利用上述训练样本数据集训练待训练的字符识别模型,得到字符识别模型,上述待训练的字符识别模型是通过将基于注意力模块的卷积神经网络以及基于注意力模块的循环神经网络依次级联而构建得到的。
根据本公开的实施例,上述待训练的字符识别模型通过以下方法构建得到:
将第一注意力模块与卷积神经网络的输出层连接,形成基于注意力模块的卷积神经网络;
将第二注意力模块设置于循环神经网络的隐藏层和输出层之间,形成基于注意力模块的循环神经网络;以及
将上述卷积神经网络、上述第一注意力模块、上述循环神经网络以及上述第二注意力模块依次级联,构成上述待训练的字符识别模型。
根据本公开的实施例,上述第二注意力模块包括多个一维卷积,上述多个一维卷积通过全连接的形式分别与上述隐藏层连接。
根据本公开的实施例,上述利用上述训练样本数据集训练待训练的字符识别模型,得到字符识别模型,包括:
将上述训练样本数据集输入至上述卷积神经网络,输出图像中间特征序列;
将上述图像中间特征序列输入至上述第一注意力模块,输出注意力特征序列;
将上述注意力特征序列输入至上述基于注意力模块的循环神经网络模型,输出预测结果;
将上述预测结果与上述标签信息输入至上述待训练字符识别模型的损失函数,得到损失结果;
根据上述损失结果调整上述基于注意力模块的卷积神经网络的网络参数以及上述基于注意力模块的循环神经网络的网络参数,直至上述损失函数收敛;以及
将上述损失函数收敛时得到的模型作为字符识别模型。
根据本公开的实施例,上述基于注意力模块的循环神经网络包括:第一网络部分和第二网络部分,其中,上述第一网络部分包括输入层与隐藏层;上述第二网络部分包括上述第二注意力模块和输出层;
上述将上述注意力特征序列输入上述基于注意力模块的循环神经网络模型,输出预测结果包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110369780.7/2.html,转载请声明来源钻瓜专利网。