[发明专利]多任务模型训练方法、装置及计算机可读存储介质在审
申请号: | 202210568388.X | 申请日: | 2022-05-23 |
公开(公告)号: | CN114998676A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 周恩慈;张骞;黄畅 | 申请(专利权)人: | 北京地平线信息技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/80;G06V10/82;G06N3/08;G06N5/04 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 李洪娟 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务 模型 训练 方法 装置 计算机 可读 存储 介质 | ||
1.一种多任务模型训练方法,包括:
确定多个数据源对应的多组样本图像,其中,每一数据源对应一组样本图像;
确定待训练的多任务模型的目标BN参数、目标权重参数和目标偏置参数;
通过所述多组样本图像,对所述目标BN参数、所述目标权重参数和所述目标偏置参数进行第一阶段训练;
将所述目标BN参数置于推理状态;
在所述目标BN参数的推理状态下,通过所述多组样本图像对所述目标权重参数和所述目标偏置参数进行第二阶段训练。
2.根据权利要求1所述的方法,其中,
所述目标BN参数包括所述多任务模型的BN均值、BN方差、BN权重和BN偏置,所述目标权重参数包括所述多任务模型的除了BN权重之外的权重,所述目标偏置参数包括所述多任务模型的除了BN偏置之外的偏置;
或者,
所述目标BN参数包括所述多任务模型的BN均值和BN方差,所述目标权重参数包括所述多任务模型的BN权重和所述多任务模型的除了BN权重之外的权重,所述目标偏置参数包括所述多任务模型的BN偏置和所述多任务模型的除了BN偏置之外的偏置。
3.根据权利要求2所述的方法,其中,
若所述目标BN参数包括所述多任务模型的BN均值、BN方差、BN权重和BN偏置,所述将所述目标BN参数置于推理状态,包括:
将所述多任务模型中BN层的层状态值设置为第一预设值;
将所述多任务模型中BN权重和BN偏置各自的参数状态值均设置为第二预设值;
或者,
若所述目标BN参数包括所述多任务模型的BN均值和BN方差,所述将所述目标BN参数置于推理状态,包括:
将所述多任务模型中BN层的层状态值设置为第一预设值。
4.根据权利要求1所述的方法,其中,
所述将所述目标BN参数置于推理状态,包括:
将所述多任务模型中的特征提取网络的第一BN参数置于推理状态,所述第一BN参数至少包括所述特征提取网络的BN均值和BN方差;
将所述多任务模型中的特征融合网络的第二BN参数置于推理状态,所述第二BN参数至少包括所述特征融合网络的BN均值和BN方差;
所述方法还包括:
在所述第一BN参数的推理状态下,通过所述多组样本图像对所述特征提取网络的除了所述第一BN参数之外的权重和偏置,所述第二BN参数,所述特征融合网络的除了所述第二BN参数之外的权重和偏置,以及所述多任务模型中的非共享网络的权重和偏置进行第三阶段训练。
5.根据权利要求1至4中任一所述的方法,其中,
所述第一阶段训练使用的学习率为第一学习率;
所述第二阶段训练使用的学习率为第二学习率,所述第二学习率大于或等于所述第一学习率。
6.根据权利要求1至4中任一所述的方法,还包括:
响应于所述多任务模型中的非共享网络中的目标预测网络满足预设参数更新条件,将所述非共享网络中除了所述目标预测网络之外的预测网络的权重和偏置均置于推理状态;
将所述多任务模型中的共享网络的位于所述目标BN参数之外的权重和偏置均置于推理状态;
通过所述多组样本图像对所述目标预测网络的权重和偏置进行第四阶段训练。
7.根据权利要求6所述的方法,还包括:
响应于所述目标检测网络的权重和偏置均置于推理状态,将所述目标检测网络的权重和偏置由推理状态切换为训练状态;
所述通过所述多组样本图像对所述目标预测网络的权重和偏置进行第四阶段训练,包括:
在所述目标预测网络的权重和偏置的训练状态下,通过所述多组样本图像对所述目标预测网络的权重和偏置进行第四阶段训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线信息技术有限公司,未经北京地平线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210568388.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多层压合制作方法
- 下一篇:对绘画内容局部操作的方法、电子设备及存储介质