[发明专利]模型训练方法、装置、存储介质及程序产品在审
申请号: | 202111536518.3 | 申请日: | 2021-12-15 |
公开(公告)号: | CN116266391A | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 吴一鸣;施克游 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/762;G06V10/74 |
代理公司: | 北京格罗巴尔知识产权代理事务所(普通合伙) 11406 | 代理人: | 项军花 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 存储 介质 程序 产品 | ||
本申请涉及一种模型训练方法、装置、存储介质及程序产品,所述方法包括:根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签;根据待预测样本中的多维度数据得到待预测样本的超图;根据超图对待预测样本的标签进行修正,得到修正后的标签;根据修正后的标签对第一预测模型进行训练,得到第二预测模型。根据本申请实施例的模型训练方法,在源域模型的基础上,根据视觉维度信息和时空维度信息的关联关系训练得到适应于目标域的模型,使得得到的模型对目标域的适应性更强,从而能提升使用得到的模型进行特征提取的效果,进而提升对目标域的数据的识别效果。
技术领域
本申请涉及深度学习领域,尤其涉及一种模型训练方法、装置、存储介质及程序产品。
背景技术
近年来,深度学习在人脸识别、人体识别等方面取得了重大突破,其成功主要归因于深度学习使用大量标注数据用于模型的训练。在实际应用中,使用源域(旧场景)的标注数据训练得到的源域模型,对于源域下的无标注数据进行特征提取的效果是比较好的。然而,在目标域(新场景)数据与源域数据存在统计分布差异时,源域模型对于目标域的无标注数据的特征提取却有诸多问题。一方面,为了保证特征提取具有较好效果,可以对目标域的数据进行标注,再基于目标域的标注数据进行模型训练,但大规模标注数据的数据处理成本过于巨大。另一方面,为了降低数据处理成本,可以直接在目标域使用源域模型,但由于目标域的数据未经标注,会使得源域模型在目标域中的性能大幅下降。
综上所述,现有技术的方案在如何提升源域模型在目标域的性能方面仍有优化空间。
发明内容
有鉴于此,提出了一种模型训练方法、装置、存储介质及程序产品,根据本申请实施例的模型训练方法,在源域模型的基础上,根据视觉维度信息和时空维度信息的关联关系训练得到适应于目标域的模型,使得得到的模型对目标域的适应性更强,从而能提升使用得到的模型进行特征提取的效果,进而提升对目标域的数据的识别效果。
第一方面,本申请的实施例提供了一种模型训练方法,所述方法包括:根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签,所述待预测样本中包括多维度数据,所述多维度数据至少包括图像数据和与图像数据对应的时空数据;根据待预测样本中的多维度数据得到待预测样本的超图,所述超图以待预测样本作为顶点、以样本间多维度下的关联程度作为超边缘;根据所述超图对待预测样本的标签进行修正,得到修正后的标签;根据所述修正后的标签对所述第一预测模型进行训练,得到第二预测模型。
根据本申请实施例的模型训练方法,根据待预测样本中的多维度数据可以得到待预测样本的超图,由于待预测样本中包括多维度数据,因此待预测样本的超图可以包括样本间多维度下的关联程度信息。再根据超图对使用第一预测模型得到的待预测样本的标签进行修正,得到修正后的标签,使得修正后的标签也因考虑了样本间多维度下的关联程度而更加准确。进一步使得根据修正后的标签对第一预测模型进行训练得到的第二预测模型的性能也有所提升。从而能提升使用得到的模型进行特征提取的效果,进而提升对目标域的数据的识别效果。
根据第一方面,在所述模型训练方法的第一种可能的实现方式中,所述根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签,包括:将待预测样本中的图像数据输入所述第一预测模型,得到待预测样本的视觉特征;根据所述待预测样本的视觉特征得到待预测样本的样本间相似度;根据所述样本间相似度对待预测样本进行聚类,根据聚类结果得到待预测样本的标签。
通过这种方式,可以完成待预测样本的聚类,得到待预测样本的标签。聚类根据由样本视觉特征得到的样本间相似度来实现,能够保证聚类的结果在视觉维度下具有一定的准确度。
根据第一方面或第一方面的第一种可能的实现方式,在所述模型训练方法的第二种可能的实现方式中,所述根据待预测样本中的多维度数据得到待预测样本的超图,包括:根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵;根据所述至少一个相似度矩阵得到待预测样本的超图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111536518.3/2.html,转载请声明来源钻瓜专利网。