[发明专利]一种多损失模型获取方法以及装置在审

申请号：	202010754299.5	申请日：	2020-07-30
公开（公告）号：	CN112070205A	公开（公告）日：	2020-12-11
发明（设计）人：	徐航;张耕维;李震国;梁小丹;黎嘉伟;陈翼翼	申请（专利权）人：	华为技术有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	李杭
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种损失模型获取方法以及装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例涉及人工智能领域，提供了一种多损失模型获取方法以及装置，用于实现在多损失模型训练过程中动态调整损失加权值，从而使得多损失模型得到更好的训练结果。在该多损失模型训练过程中，在第一迭代周期，获取该子网络输出的第一损失值；然后根据该第一损失值生成备选权重；将该第一损失值以及该备选权重输入权重预测模型，输出该子网络的第一权重参数，其中，该第一权重参数用于该多损失模型训练过程中的第二迭代周期的训练，该第二迭代周期为该第一迭代周期的下一下迭代周期；最后根据该第一权重参数更新该多损失模型的参数。

技术领域

本申请涉及人工智能领域，尤其涉及一种多损失模型获取方法以及装置。

背景技术

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人，自然语言处理，计算机视觉，决策与推理，人机交互，推荐与搜索，AI基础理论等。

目前通常是通过神经网络实现AI的各种功能，例如自然语言处理、图像处理、语音处理等。随着AI技术的发展，AI的功能逐渐多样化。以全景分割任务为例，该全景分割任务包括实例分割、分类，回归、实例掩膜(instance mask)、语义分割(semanticsegmentation)等多个子任务。每一个子任务存在一个优化目标。在全景分割任务对应的模型训练过程中，每个子任务进行优化时都对应一个子网络，而每个子网络对应多个损失值，然后根据该损失值通过反向传播算法优化神经网络参数，因此最终输出的模型也称之为多损失模型。而多损失模型的训练过程中，每个子网络之间的竞争平衡决定着多损失模型的最终训练效果。比如在全景分割任务对应的神经网络模型训练中，检测任务和分割任务的训练相互竞争，会导致某一个子任务地分割效果不佳，因此需要对多个任务间的训练问题进行自动优化。同时在多任务应用场景下，每个子网络对损失加权值的敏感性十分高。

而目前已有的方法通常利用采样等方式进行超参数的搜索优化，并不能针对性的对损失加权值进行优化。因此对于多损失模型训练过程中如何更好的优化损失加权值是急需解决的问题。

发明内容

本申请实施例提供了一种多损失模型获取方法以及装置，用于实现在多损失模型训练过程中动态调整损失加权值，从而使得多损失模型得到更好的训练结果。

第一方面，本申请实施例提供一种多损失模型获取方法，其应用于包括至少一个子网络(即子任务)的多损失模型的获取场景。在该多损失模型训练过程中，在第一迭代周期，该多损失模型获取装置获取该子网络输出的第一损失值；然后该多损失模型获取装置根据该第一损失值生成备选权重；下一步，该多损失模型获取装置将该第一损失值以及该备选权重输入权重预测模型，输出该子网络的第一权重参数，其中，该第一权重参数用于该多损失模型训练过程中的第二迭代周期的训练，其中，该第二迭代周期为该第一迭代周期的下一个迭代周期；最后该多损失模型训练根据该第一权重参数更新该多损失模型的参数。

可以理解的是，上述仅描述了训练过程中的一个迭代过程，而该第一迭代周期和该第二迭代周期也仅用于区别迭代周期，并不用于限定训练过程中的某一个特定的迭代周期。在具体应用中，该多损失模型训练过程中具有多个上述迭代过程。在该多损失模型的训练迭代周期完成(即相当于模型的搜索过程完成)之后，该多损失模型获取装置输出训练好的多损失模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010754299.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多损失模型获取方法以及装置在审

专利文献下载