[发明专利]识别模型的训练方法、字符识别方法、装置、设备和介质在审
申请号: | 202010672462.3 | 申请日: | 2020-07-14 |
公开(公告)号: | CN111898620A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 冯晓锐 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 周清华 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 模型 训练 方法 字符 装置 设备 介质 | ||
本申请涉及一种识别模型的训练方法、字符识别方法、装置、设备和介质。所述方法包括:根据样本字符图像,采用第一教师网络对识别模型的初始特征提取网络进行训练,得到特征提取网络;根据样本字符图像,采用第二教师网络对识别模型的初始时序网络进行训练,得到时序网络;其中,在初始时序网络的训练过程中特征提取网络的参数固定不变;根据特征提取网络和时序网络,得到识别模型。采用本方法能够减少了训练过程的耗时,得到的识别模型的网络结构比较简单,提升了得到的识别模型的识别效率,使得最终得到的识别模型的性能得到了提升。
技术领域
本申请涉及字符识别技术领域,特别是涉及一种识别模型的训练方法、字符识别方法、装置、设备和介质。
背景技术
随着光学字符识别(Optical Character Recognition,OCR)模型被越来越广泛地运用在各种场景中。因此,为了使OCR识别模型能够适应于各种不同的应用场景,需要对OCR识别模型进行多次优化,增加OCR识别模型的通用性。
传统技术中,为了增加OCR识别模型的通用性,通常会使用一个较大的网络,利用知识蒸馏的思想,对较大的网络进行训练和优化,得到一个效果较好的小网络,用得到的小网络代替大网络完成对OCR识别模型进行优化。
然而,传统的对OCR识别模型的优化方法,存在耗时较长的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够缩短OCR识别模型优化时间的识别模型的训练方法、字符识别方法、装置、设备和介质。
一种识别模型的训练方法,所述方法包括:
根据样本字符图像,采用第一教师网络对识别模型的初始特征提取网络进行训练,得到特征提取网络;
根据所述样本字符图像,采用第二教师网络对所述识别模型的初始时序网络进行训练,得到时序网络;其中,在所述初始时序网络的训练过程中所述特征提取网络的参数固定不变;
根据所述特征提取网络和所述时序网络,得到识别模型。
在其中一个实施例中,所述根据样本字符图像,采用第一教师网络对识别模型的初始特征提取网络进行训练,得到特征提取网络,包括:
将所述样本字符图像输入所述第一教师网络的特征提取网络,通过所述第一教师网络的特征提取网络得到所述样本字符图像的第一特征图,将所述第一特征图输入所述第一教师网络的时序网络,得到第一识别结果;所述第一识别结果为所述第一教师网络对所述样本字符图像中字符的识别结果;
将所述样本字符图像输入所述初始特征提取网络,通过所述初始特征提取网络得到所述样本字符图像的第一样本特征图,将所述第一样本特征图输入所述初始时序网络,得到第一样本识别结果;
根据所述第一特征图、所述第一样本特征图和所述第一样本识别结果,得到所述初始特征提取网络的损失函数的值;
根据所述初始特征提取网络的损失函数的值,对所述初始特征提取网络进行训练,得到所述特征提取网络。
在其中一个实施例中,所述初始特征提取网络的损失函数的计算公式为:L1=β*smoothL1loss+μCrossEntropy(y,pre),式中,L1表示初始特征提取网络的损失函数,β、μ均为参数,y表示所述样本字符图像对应的标准识别结果,pre表示所述第一样本识别结果,CrossEntropy表示交叉熵损失函数,smoothL1loss为根据所述第一特征图和所述第一样本特征图所得到的损失值。
在其中一个实施例中,所述根据所述样本字符图像,采用第二教师网络对所述识别模型的初始时序网络进行训练,得到时序网络,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010672462.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微晶玻璃加石墨烯复合导电膜组成的加热体制备方法
- 下一篇:胶条上料组件