[发明专利]用于训练模型的方法、装置、设备、介质和程序产品有效
申请号: | 202110442612.6 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113139463B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 郭若愚;杜宇宁;李晨霞;杨烨华;赵乔;刘其文;毕然;胡晓光;于佃海;马艳军 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V10/80;G06V10/82;G06V30/10;G06K9/62;G06N3/04 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 模型 方法 装置 设备 介质 程序 产品 | ||
根据本公开的示例实施例,提供了一种用于训练模型的方法、装置、设备、介质和程序产品。涉及人工智能领域,尤其涉及深度学习和图像处理技术领域。具体实现方案为:将第一模型针对训练样本输出的第一特征和第二模型针对训练样本输出的第二特征组合,以获得组合特征,第一模型和第二模型被初始化以具有不同的模型参数;基于第一特征、第二特征和组合特征之间的差异,分别确定第一约束、第二约束和第三约束;以及至少基于第一约束、第二约束和第三约束,训练第一模型和第二模型。根据本公开的实施例,能够优化训练所得的模型的性能。
技术领域
本公开涉及人工智能领域,并且更具体地,涉及用于训练模型的方法、装置、设备、计算机可读存储介质和计算机程序产品。
背景技术
随着信息技术的发展,神经网络被广泛用于诸如计算机视觉、语音识别和信息检索等的各种机器学习任务。光学字符识别(OCR)是一项可以将图片信息转换为更易编辑和存储的文本信息的技术。利用神经网络进行OCR识别被验证为是一种有效的识别方法。然而,所训练的模型的准确性还有待提高。
发明内容
根据本公开的示例实施例,提供了一种用于训练模型的方法、装置、设备、计算机可读存储介质和计算机程序产品。
在本公开的第一方面中,提供了一种用于训练模型的方法。该方法包括:将第一模型针对训练样本输出的第一特征和第二模型针对训练样本输出的第二特征组合,以获得组合特征,第一模型和第二模型被初始化以具有不同的模型参数;基于第一特征、第二特征和组合特征之间的差异,分别确定第一约束、第二约束和第三约束;以及至少基于第一约束、第二约束和第三约束,训练第一模型和第二模型。
在本公开的第二方面中,提供了一种用于训练模型的装置。该装置包括:特征融合模块,被配置为将第一模型针对训练样本输出的第一特征和第二模型针对训练样本输出的第二特征组合,以获得组合特征,第一模型和第二模型被初始化以具有不同的模型参数;第一约束确定模块,被配置为基于第一特征、第二特征和组合特征之间的差异,分别确定第一约束、第二约束和第三约束;以及第一模型训练模块,被配置为至少基于第一约束、第二约束和第三约束,训练第一模型和第二模型。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第二方面的方法。
在本公开的第五方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
在本公开的第六方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第二方面的方法。
在本公开的第七方面中,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令被处理器实现如本公开的第一方面的方法。
在本公开的第八方面中,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令被处理器实现如本公开的第二方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素。附图用于更好地理解本方案,不构成对本公开的限定,其中:
图1A示出了本公开的一些实施例能够在其中实现的数据处理的环境的示例的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110442612.6/2.html,转载请声明来源钻瓜专利网。