[发明专利]基于多目标检测模型无标签的知识蒸馏方法及存储介质在审
申请号: | 202110838933.8 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113610126A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 卢涛;顾宇;张彦铎;吴云韬 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 黄帅 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多目标 检测 模型 标签 知识 蒸馏 方法 存储 介质 | ||
1.一种基于多目标检测模型无标签的知识蒸馏方法,其特征在于,包括以下步骤:
S1、获取多类别数据集;
S2、先利用不同类别的数据集训练出不同的教师网络模型,而后将无标签的图片输入至学生网络和多个教师网络模型,从而使教师网络模型引导学生网络训练;其中,学生网络的类别为多个教师网络类别的组合;
S3、设计全局蒸馏损失以及自适应损失,平衡多个不同教师网络和学生网络之间的蒸馏损失,平衡不同教师网络之间的语言特性,优化学生网络训练过程。
2.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,数据集的类别大于等于2。
3.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,多类别数据集包括CrowdHuman数据集、WiderFace数据集、SHWD数据集。
4.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,步骤S2包括:
利用不同类别的数据集训练出不同的教师网络模型,将图片输入至学生网络和多个教师网络模型,将学生网络头部输出和不同教师网络头部输出计算蒸馏损失,采用反向传播梯度下降方法引导学生网络训练;学生网络的类别为不同教师网络类别的组合,类别通道数一一对应并分别结算分类损失,同理,相继计算出回归损失以及偏置损失。
5.根据权利要求4所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,利用不同类别的数据集训练出不同的教师网络模型具体为:通过Teacher-i网络中backbone模块和Neck模块得到相应的头部输出,包括heatmap图,即对应的分类信息Ki和宽高的回归信息、中心点坐标的偏置信息;其中,i∈1,2,3…n,n表示总类别数。
6.根据权利要求5所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,引导学生网络训练时,在学生网络的分类头部中加入分类注意力模块。
7.根据权利要求6所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,引导学生网络训练时,先将分类预测头的输入通过卷积层转化为类别特征图C×H×W,其中C为目标类别数,H和W为特征图的高度和长度尺寸,再通过卷积层构建类内注意力图HW×1×1,经过Softmax层归一化,并与原特征图进行矩阵乘法,获得类间特征图C×1×1,并通过Excitation操作,最后将类间注意力图C×1×1通过广播逐元素加法叠加到原特征图中,完成类别特征的提取。
8.根据权利要求7所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,步骤S3包括:
对类别预测头的输出使用Leaky ReLU进行约束,再进行教师和学生网络间的模拟,类别蒸馏损失如下:
式中,S表示学生网络,T表示教师网络,Hijc为网络的分类头部输出,k,h,w分别对应着特征图的类别通道数、高和宽,l()代表Leaky ReLU约束;
中心点偏移量蒸馏损失如下:
式中,N表示该幅图像中关键点的个数,即正样本个数,O表示目标中心点的偏置量,所有的类别共享相同的偏移量预测,Loffset采用L1损失,只对目标中心点位置进行约束,忽略所有其他位置,并将处的特征作为权重叠加在对应位置;
尺度蒸馏损失如下:
式中,Si为学生或教师网络中宽高预测头输出的对应位置的预测结果,将特征作为权重叠加;
每一个教师网络和学生网络之间分别计算蒸馏损失,最后将不同教师网络的损失进行加权求和,总的损失函数为:
其中,λt是教师和学生网络之间蒸馏权重,αt、βt和γt为不同蒸馏损失间的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110838933.8/1.html,转载请声明来源钻瓜专利网。