[发明专利]神经网络训练、目标检测的方法及装置、设备及存储介质在审
申请号: | 202210333676.7 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114648650A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 高梦雅 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 袁忠林 |
地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 目标 检测 方法 装置 设备 存储 介质 | ||
本公开提供了一种神经网络训练、目标检测的方法及装置、设备及存储介质,其中,该方法包括:获取上游任务中采集的第一图像样本、下游任务中待训练的第一神经网络、以及基于第一图像样本训练得到的第二神经网络和图像生成网络;第二神经网络用于进行特征提取,图像生成网络用于生成新图像,且新图像符合第一图像样本的整体分布;分别根据训练得到的第二神经网络和待训练的第一神经网络对基于图像生成网络生成的新图像进行特征提取;基于提取的第一图像特征和第二图像特征对待训练的第一神经网络进行训练,得到训练好的第一神经网络。本公开通过两个图像特征可以更好地指导第一神经网络的训练,从而提升在下游任务的表现性能。
技术领域
本公开涉及人工智能技术领域,具体而言,涉及一种神经网络训练、目标检测的方法及装置、设备及存储介质。
背景技术
随着人工智能技术的飞速发展,基于端到端的深度学习技术也日趋成熟。利用大规模数据集可以在上游为各类任务共同学习一个预训练神经网络(即预训练模型),该模型可以直接共享预训练好的早期权重,具有较为强大的特征表示能力。
然而,在将预训练模型迁移到下游特定任务的过程中,由于在下游实际上所能获取到的数据量比较少,这导致不管是直接进行模型迁移,还是在对预训练模型进行微调后再进行迁移,预训练模型在下游任务中的表现性能都不佳。
发明内容
本公开实施例至少提供一种神经网络训练、目标检测的方法及装置、设备及存储介质。
第一方面,本公开实施例提供了一种神经网络训练的方法,所述方法包括:
获取上游任务中采集的第一图像样本、下游任务中待训练的第一神经网络、以及基于所述第一图像样本训练得到的第二神经网络和图像生成网络;所述第二神经网络用于进行特征提取,所述图像生成网络用于生成新图像,且所述新图像符合所述第一图像样本的整体分布;
分别根据训练得到的所述第二神经网络和所述待训练的第一神经网络对基于所述图像生成网络生成的新图像进行特征提取,得到第一图像特征和第二图像特征;
基于所述第一图像特征和所述第二图像特征对所述待训练的第一神经网络进行训练,得到训练好的第一神经网络。
采用上述神经网络训练的方法,可以分别根据下游任务中待训练的第一神经网络和基于上游任务中采集的第一图像样本训练得到的第二神经网络对基于图像生成网络生成的新图像进行特征提取,而后可以根据得到的第一图像特征和第二图像特征对第一神经网络进行训练。由于基于图像生成网络生成的新图像是更为符合第一图像样本的整体分布的图像样本,这样的图像样本会更有利于适应于第二神经网络的网络环境,与此同时,通过训练好的第二神经网络输出的第一图像特征以及待训练的第一神经网络输出的第二图像特征可以更好地指导第一神经网络的训练,从而进一步提升在下游任务的表现性能。
在一种可能的实施方式中,按照如下步骤训练所述图像生成网络:
获取基于码本生成网络输出的第一图像;所述码本生成网络用于生成将所述第一图像样本分解为包含多个基元的码本;
将所述第一图像输入至所述待训练的图像生成网络,得到所述图像生成网络输出的第二图像;
基于所述第二图像与所述第一图像之间的图像相似度,确定所述待训练的图像生成网络的损失函数值;
基于所述损失函数值对所述待训练的图像生成网络进行训练,得到训练好的图像生成网络。
这里,可以通过码本编码方式输出的第一图像对待训练的图像生成网络进行训练,这样所训练得到的图像生成网络更为符合第一图像样本的整体分布,从而有利于提升后续的网络训练性能。
在一种可能的实施方式中,所述将所述第一图像输入至所述待训练的图像生成网络,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210333676.7/2.html,转载请声明来源钻瓜专利网。