[发明专利]一种基于知识蒸馏的行人重识别方法有效
申请号: | 202011431855.1 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112560631B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 尚振宏;李粘粘 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V20/52;G06V40/10;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 昆明科众知识产权代理事务所(普通合伙) 53218 | 代理人: | 蒋晗 |
地址: | 650500 *** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 行人 识别 方法 | ||
1.一种基于知识蒸馏的行人重识别方法,其特征在于,包括以下几个步骤:
步骤1,将行人图像训练集输入到resnet50的PCB作为教师网络,将同样数据集输入到resnet18的PCB作为学生网络;
步骤2,通过学生网络转移,特征蒸馏位置,距离损失函数协同作用,在整个骨干网络的多个阶段同时进行蒸馏,使学生网络的特征输出不断接近教师网络输出的特征;
步骤3,通过蒸馏损失函数Ldistill最小化更新学生模型的参数,训练学生网络;
步骤4,对得到的特征向量进行距离的度量,搜索出相似度最高的行人目标图;
所述步骤1中的教师网络为训练好的模型,且与学生网络完成相同任务的复杂模型,用来辅助训练学生网络;教师网络以骨干网络为resnet50的PCB的网络结构进行训练,学生网络以骨干网络为resnet18的PCB网络通过蒸馏方法模仿教师模型进行训练;骨干网络输出的特征图纵向均匀切分成6部分,即6个空间大小4*8张量,然后各自进行全局平均池化,得到6个特征A,在用1×1卷积对特征A进行降为通道数,然后再分别接全连接层和softmax;
所述步骤2中所述学生网络转移过程如下:改变学生网络的维度,对学生网络的特征图进行处理,让学生网络经过1*1卷积升维到与对应的教师网络特征图通道数,并且,取ReLU之前的特征图进行蒸馏,则特征图中的值既包括正数也包括负数,学生网络只需要尽可能的靠近教师网络的正值,而对于负数值,学生网络的输出无需与教师网络负值完全一致,而只需和教师网络一样为负即可;这样在经过ReLU层后,无论教师网络还是学生网络的负值都会输出0;
所述步骤2中蒸馏位置选择在骨干网络的多个下采样阶段进行,当骨干网络采用resnet时,在resnet的Conv2_x、Conv3_x、Conv4_x、Conv5_x末端进行;蒸馏方法结构分为两部分,第一部分在骨干网络的不同阶段进行蒸馏;第二部分对全连接层后的特征进行蒸馏;最终使学生网络输出的全连接层后的特征sFeatureD尽可能与教师网络输出的特征tFeatureD相似;
所述步骤2中第一部分在骨干网络部分的蒸馏的损失函数,教师网络和学生网络在骨干网络的各个阶段提取的特征N,S∈RW×H×C,特征中第i位的值Ni,Si∈R,R为特征图三维向量,W是宽,H为高,C为通道数;在学生网络用于蒸馏的特征经过1×1卷积和批量归一化转换成与教师网络用于蒸馏的特征维度一致后,计算学生和教师网络特征的距离,如式(1)所示;
式(1)中N表示教师特征,S表示学生特征,dp(N,S)表示距离函数,通过dp(N,S)计算出的距离损失函数使学生网络在骨干网络的多个阶段输出都与教师网络对应的阶段输出越来越相似,从而促使网络提取的人体特征也能更加相似,将r作为学生骨干网络提取特征图后做的1×1卷积和批量归一化的转换函数,则第一部分的蒸馏损失函数定义如式(2)所示:
Ldistill1=dp(Fn,r(Fs)) (2)
式(2)中Fn表示教师特征,Fs表示学生网络转换前的学生特征;
所述步骤2中第二部分蒸馏是针对提取的人体特征,也就是全连接层后的网络特征进行蒸馏;利用Hinton提出的改进的Softmax损失函数如式(3)所示:
式(3)中T是指temperature参数,当T等于1时就是标准的softmax函数;当T增大时,softmax输出的概率分布就会变得更加平滑,这样就可以利用到教师网络的更多信息;
在训练学生网络的时候,学生网络的softmax函数使用与教师网络相同的T,损失函数以教师网络输出的软标签为目标;这样的损失函数称为″distillation loss″;在训练过程使用正确的数据标签会使效果更好;具体方法是,在计算distillation loss的同时,利用hard label把标准的损失T=1也计算出来,这个损失称之为“student loss”;将两种损失整合得到第二部分的蒸馏损失函数,整合公式如式(4)所示:
Ldistill2(x;θ)=α*M(y,σ(zs;T=1))+β*M(σ(zt;T=τ),σ(zs,T=τ)) (4)
式(4)中x是输入,θ是学生模型的参数,M是交叉熵损失函数,y是真实标签,σ是参数有T的函数,α,β是超参数,zs,zt分别是学生和教师的logits输出;
所述步骤3中最终得到知识蒸馏行人重识别的损失函数如式(5)所示:
Ldistill=λ*Ldistill1+μLdistill2 (5)
式(5)中λ、μ均为常数。
2.根据权利要求1所述的一种基于知识蒸馏的行人重识别方法,其特征在于:所述步骤4将待识别图像的特征向量与图像集的行人特征向量进行对比,搜索出相似度最高的行人目标图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011431855.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:外壳按压装置
- 下一篇:动态维度存量管理方法、系统和可读存储介质