[发明专利]模型训练方法和装置在审
申请号: | 202210223406.0 | 申请日: | 2022-03-07 |
公开(公告)号: | CN114627331A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 杨一博;陈亚鑫;马本腾;陶大程 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/778;G06V10/26;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 王志远;张一军 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 | ||
1.一种模型训练方法,其特征在于,包括:
将样本集中预先标注语义分割标签的多幅训练图像分别输入训练完成的教师模型和待训练的学生模型,将所述学生模型对所述训练图像中像素所属类别的预测结果与所述语义分割标签之间的概率分布差异确定为第一差异;以及,
所述学生模型和所述教师模型都包括主体网络和连接在所述主体网络之后的广义归一化层;对于所述学生模型和所述教师模型的主体网络输出的、对应于所述多幅训练图像的特征图:转换为所述类别的联合特征后进入所述广义归一化层,和/或,基于预设的切分规则在高度和宽度维度被切分为多个分离特征后进入所述广义归一化层;其中,每一类别的联合特征包括对应于所述多幅训练图像的特征图中的像素属于该类别的概率数据;每一分离特征包括该特征图处在同一切分空间的像素属于所述类别的概率数据;
使用第一差异结合第二差异和/或第三差异构造所述学生模型的损失函数来训练所述学生模型;其中,第二差异是基于所述学生模型和所述教师模型的所述联合特征确定的,第三差异是基于所述学生模型和所述教师模型的所述分离特征确定的。
2.根据权利要求1所述的方法,其特征在于,任一类别的联合特征根据以下步骤确定:
获取相应主体网络输出的、对应于所述多幅训练图像的多通道特征图中各像素属于该类别的概率数据;
将各像素属于该类别的概率数据合并为该类别的联合特征。
3.根据权利要求1所述的方法,其特征在于,所述分离特征进一步由所述特征图执行通道维度的切分、并经类别维度的聚合而形成;
经通道、高度和宽度维度切分形成的任一切分空间对应于任一类别的分离特征包括:该切分空间的像素属于该类别的概率数据。
4.根据权利要求1所述的方法,其特征在于,在所述学生模型形成联合特征的情况下,所述教师模型形成联合特征;在所述教师模型形成联合特征的情况下,所述学生模型形成联合特征;在所述学生模型形成分离特征的情况下,所述教师模型形成分离特征;在所述教师模型形成分离特征的情况下,所述学生模型形成分离特征;以及,所述使用第一差异结合第二差异和/或第三差异构造所述学生模型的损失函数,包括:
将第一差异和第二差异的加权和确定为所述损失函数;或者,
将第一差异和第三差异的加权和确定为所述损失函数;或者,
将第一差异、第二差异和第三差异的加权和确定为所述损失函数。
5.根据权利要求2所述的方法,其特征在于,每一类别的联合特征在进入所述广义归一化层之后,执行该联合特征内部的归一化,形成该类别的第一归一化特征;以及,第二差异根据以下步骤确定:
计算所述学生模型与所述教师模型对应于同一类别的第一归一化特征的KL散度;
将各类别的KL散度的平均值确定为第二差异。
6.根据权利要求3所述的方法,其特征在于,经通道、高度和宽度维度切分形成的任一切分空间对应于任一类别的分离特征在进入所述广义归一化层之后,执行该分离特征内部的归一化,形成该切分空间和该类别的第二归一化特征;以及,第三差异根据以下步骤确定:
计算所述学生模型与所述教师模型对应于同一位置切分空间以及同一类别的第二归一化特征的KL散度;
将各位置切分空间以及各类别的KL散度的平均值确定为第三差异。
7.根据权利要求1-6任一所述的方法,其特征在于,所述学生模型的特征图进入狭义归一化层进行计算,所述预测结果是基于所述狭义归一化层的计算结果确定的;以及,
狭义归一化层包括温度参数等于1的Softmax层,广义归一化层包括温度参数不等于1的Softmax层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210223406.0/1.html,转载请声明来源钻瓜专利网。