[发明专利]网络训练方法、装置、电子设备及存储介质在审
申请号: | 202310106978.5 | 申请日: | 2023-01-29 |
公开(公告)号: | CN116050498A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 劳珊珊;宋广录;刘博晓;刘宇 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06V10/40;G06V10/82 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 王文红 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 训练 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种网络训练方法、装置、电子设备及存储介质,该方法包括:获取训练样本图像及与训练样本图像对应的掩码样本图像;将掩码样本图像输入至第一网络,得到与掩码样本图像对应的第一多层级特征图;将样本图像输入至第二网络,得到与样本图像对应的第二多层级特征图;第二网络的规模大于第一网络的规模;基于解码器以及与第一多层级特征图中每个特征图分别对应的掩码图像,对第一多层级特征图进行特征恢复处理,得到恢复处理后的第一多层级特征图;每个特征图对应的掩码图像由目标掩码图像分别进行缩放处理后得到;基于恢复处理后的第一多层级特征图及第二多层级特征图对第一网络进行训练,以提升第一网络的性能。
技术领域
本公开涉及人工智能技术领域,具体而言,涉及一种网络训练方法、装置、电子设备及存储介质。
背景技术
知识蒸馏也称为师生学习,是一种有效的模型压缩和模型精度提升的技术,通过知识蒸馏可以将知识从容量更高的教师模型转移到可部署性更强、容量较小的学生模型,进而来提升学生模型的性能。
经研究发现,针对密集视觉检测任务,由于密集视觉检测任务对于图像的定位信息更加敏感,目前的知识蒸馏方法主要基于对教师特征图的模仿。然而,该基于特征图的知识蒸馏,通常将完整的图像输入学生网络,然后进行逐像素一对一的空间模仿,该模仿过程相对简单,导致学生模型的学习能力得不到较好的挖掘,学生模型的性能较差。
发明内容
本公开实施例至少提供一种网络训练方法、装置、电子设备及存储介质,能够提升学生网络的性能。
公开实施例提供了一种网络训练方法,包括:
获取训练样本图像以及与所述训练样本图像对应的掩码样本图像;其中,所述掩码样本图像由所述训练样本图像以及目标掩码图像生成;
将所述掩码样本图像输入至第一网络,并基于所述第一网络的第一特征提取网络对所述掩码样本图像进行特征提取,得到与所述掩码样本图像对应的第一多层级特征图;
将所述样本图像输入至第二网络,并基于所述第二网络的第二特征提取网络对所述样本图像进行特征提取,得到与所述样本图像对应的第二多层级特征图;所述第二网络的规模大于所述第一网络的规模;
基于解码器以及与所述第一多层级特征图中每个特征图分别对应的掩码图像,对所述第一多层级特征图进行特征恢复处理,得到恢复处理后的第一多层级特征图;其中,所述第一多层级特征图中每个特征图对应的掩码图像由所述目标掩码图像分别进行缩放处理后得到;
基于所述恢复处理后的第一多层级特征图以及所述第二多层级特征图对所述第一网络进行训练,并重复上述步骤,直到所述第一网络的训练结果符合预设要求,得到训练好的第一网络。
本公开实施例中,第一网络也称学生网络,第二网络也称教师网络,在基于特征进行知识蒸馏的过程中,通过对训练样本图像进行掩码处理,并通过模仿第二网络的输出的第二层级特征图恢复被掩码区域对应的特征,进而可以增加特征模仿的难度,也即,在不改变第一网络的网络结构的前提下,通过单独的解码器对蒸馏过程进行增强,进而可以提升第一网络的学习能力,如此,即使在输入的待检测图像存在部分被遮盖情况下,通过训练好的第一网络也能够进行检测识别,从而提升了第一网络的检测性能。
在一种可能的实施方式中,所述第一特征提取网络包括呈金字塔结构的特征提取模块,所述将所述掩码样本图像输入至第一网络,并基于所述第一网络的第一特征提取网络对所述掩码样本图像进行特征提取,得到与所述掩码样本图像对应的第一多层级特征图,包括:
将所述掩码样本图像输入至第一网络,并基于所述特征提取模块对所述掩码样本图像进行特征提取,得到中间多层级特征图,并将所述中间多层级特征图作为所述第一多层级特征图;其中,所述中间多层级特征图包括多张尺寸不同的中间特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310106978.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:碳纤维载板的清洗方法及清洗系统
- 下一篇:一种土体模拟图像生成方法及系统