[发明专利]一种模型训练方法及其相关联设备在审
申请号: | 202110217479.4 | 申请日: | 2021-02-26 |
公开(公告)号: | CN113065633A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 何建忠;陈帅军;贾旭;刘健庄 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/58 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 及其 相关 设备 | ||
本申请提供人工智能领域中一种模型训练方法及其相关联设备,在确定用于更新模型参数的损失的过程中,所考虑的因素较为全面,故得到的神经网络具有较强的泛化能力。本申请的方法包括:获取与目标域图像相关联的第一源域图像和与目标域图像相关联的第二源域图像;通过第一待训练模型获取第一源域图像的第一预测标签和第二源域图像的第二预测标签;根据第一预测标签和第二预测标签,获取第一损失,第一损失用于指示第一预测标签和第二预测标签之间的差异;根据第一损失更新第一待训练模型的参数,得到第一神经网络。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种模型训练方法及其相关联设备。
背景技术
图像语义分割是计算机视觉领域的核心任务之一,该技术可通过神经网络对图像进行特征提取,从而为图像中每个像素点赋予其所属类别的标签。在图像语义分割技术中,为了节省神经网络的训练过程所需的时间成本,领域自适应技术应运而生。
在领域自适应技术中,可先获取待训练模型、目标域图像以及与目标域图像相关联源域图像,其中,源域图像中每个像素点的标签是已知的。然后,通过待训练模型获取目标域图像的预测标签以及源域图像的预测标签,并基于目标域图像的预测标签以及源域图像的预测标签确定待训练模型对应的损失。最后,利用该损失更新待训练模型的参数,从而完成待训练模型的训练,可得到用于图像语义分割的神经网络。
上述训练过程中,仅基于源域图像与目标域图像之间的关系,确定用于更新模型参数的损失。由于考虑的因素较为单一,故基于此种方式训练得到的神经网络,往往泛化能力较差。
发明内容
本申请实施例提供了一种模型训练方法及其相关联设备,在确定用于更新模型参数的损失的过程中,所考虑的因素较为全面,故得到的神经网络具有较强的泛化能力。
本申请实施例的第一方面提供了一种模型训练方法,该方法包括:
当要对第一待训练模型和第二待训练模型进行训练时,可先获取与目标域图像相关联的第一源域图像和与目标域图像相关联的第二源域图像。其中,第一源域图像和第二源域图像为从属于不同源域的两个图像。
然后,通过第一待训练模型获取第一源域图像的第一预测标签和第二源域图像的第二预测标签。可以理解的是,第一预测标签为第一待训练模型对第一源域图像的预测标签,第二预测标签为第一待训练模型对第二源域图像的预测标签。
接着,根据第一预测标签和第二预测标签,获取用于更新第一待训练模型的参数的损失,即第一损失,第一损失用于指示第一预测标签和第二预测标签之间的差异。如此一来,在确定第一损失的过程中,考虑了第一源域图像、第二源域图像之间的关系。
最后,根据第一损失更新第一待训练模型的参数,直至满足模型训练条件,得到第一神经网络。
从上述方法可以看出:在获取与目标域图像相关联的第一源域图像和第二源域图像后,可通过第一待训练模型获取第一源域图像的第一预测标签和第二源域图像的第二预测标签。然后,根据第一预测标签和第二预测标签确定第一损失。在确定第一损失的过程中,考虑了第一待训练模型所得到的第一预测标签和第二预测标签之间的关系(即多个源域图像之间的关系)。由于考虑的因素较为全面,故基于第一损失进行参数更新所得到的第一神经网络,具有较强的泛化能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110217479.4/2.html,转载请声明来源钻瓜专利网。