[发明专利]字符识别模型的训练方法、装置和电子设备在审
申请号: | 202011227096.7 | 申请日: | 2020-11-05 |
公开(公告)号: | CN112364860A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 卢永晨 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 模型 训练 方法 装置 电子设备 | ||
本公开实施例公开了字符识别模型的训练方法、装置和电子设备。该方法的一具体实施方式包括:将包括字符图像的目标训练样本,导入待训练字符识别网络,得到第一字符,其中,该目标训练样本的标注数据为该字符图像指示的第二字符;根据该第二字符和该第一字符,生成第一损失值,其中,该第一损失值用于表征该第一字符和该第二字符之间的差异程度;基于第一损失值,生成第二损失值,其中,该第二损失值用于表征对该待训练字符识别网络的参数调整幅度;基于该第二损失值,对该待训练字符识别网络进行参数调整,以及基于参数调整后的待训练字符识别网络生成字符识别模型。由此,可以提供一种针对字符识别模型的新的训练方式。
技术领域
本公开涉及互联网技术领域,尤其涉及一种字符识别模型的训练方法、装置和电子设备。
背景技术
光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
字符识别模型可以用于识别字符指示的文字是什么。
发明内容
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开实施例提供了一种字符识别模型的训练方法,该方法包括:将包括字符图像的目标训练样本,导入待训练字符识别网络,得到第一字符,其中,所述目标训练样本的标注数据为所述字符图像指示的第二字符;根据所述第二字符和所述第一字符,生成第一损失值,其中,所述第一损失值用于表征所述第一字符和所述第二字符之间的差异程度;基于第一损失值,生成第二损失值,其中,所述第二损失值用于表征对所述待训练字符识别网络的参数调整幅度;基于所述第二损失值,对所述待训练字符识别网络进行参数调整,以及基于参数调整后的待训练字符识别网络生成字符识别模型。
第二方面,本公开实施例提供了一种字符识别模型的训练装置,应用于终端设备,包括:导入单元,用于将包括字符图像的目标训练样本,导入待训练字符识别网络,得到第一字符,其中,所述目标训练样本的标注数据为所述字符图像指示的第二字符;第一生成单元,用于根据所述第二字符和所述第一字符,生成第一损失值,其中,所述第一损失值用于表征所述第一字符和所述第二字符之间的差异程度;第二生成单元,用于基于第一损失值,生成第二损失值,其中,所述第二损失值用于表征对所述待训练字符识别网络的参数调整幅度;调整单元,用于基于所述第二损失值,对所述待训练字符识别网络进行参数调整,以及基于参数调整后的待训练字符识别网络生成字符识别模型。
第三方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的字符识别模型的训练方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的字符识别模型的训练方法的步骤。
本公开实施例提供的字符识别模型的训练方法、装置和电子设备,可以将目标训练样本,导入待训练字符识别网络得到第一字符(即识别结果);然后,将第一字符与第二数据(即目标训练样本的标注数据)进行比对,生成第一损失值,在这里,第一损失值可以表征第一字符和第二字符之间的差异程度;再后,基于第一损失值,生成第二损失值,在这里,第二损失值可以用于表征对网络参数进行调整的幅度;最后,可以基于第二损失值,对所述待训练字符识别网络进行参数调整,以及基于调整后的待训练字符识别网络,生成字符识别模型。由此,可以提供一种新的对于字符识别模型的训练方法,这种训练方法,可以基于待训练字符识别网络对于目标训练样本的识别效果(利用第一损失值进行表征),进行不同程度的参数调整(利用第二损失值进行表征),实现对识别效果不好的加大学习力度,提高所训练的字符识别模型的识别准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011227096.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种熔喷布专用无油漩涡气泵
- 下一篇:一种计算机零件维修用焊接加工设备