[发明专利]一种基于知识蒸馏的行人重识别方法有效
申请号: | 202011431855.1 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112560631B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 尚振宏;李粘粘 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V20/52;G06V40/10;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 昆明科众知识产权代理事务所(普通合伙) 53218 | 代理人: | 蒋晗 |
地址: | 650500 *** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 行人 识别 方法 | ||
本发明公开了一种基于知识蒸馏的行人重识别方法,所述方法包括:将行人图像训练集输入到教师网络,将同样数据集输入学生网络;通过学生网络转移,特征蒸馏位置,距离损失函数协同作用,在整个骨干网络的多个阶段同时进行蒸馏,使学生网络的特征输出不断接近教师网络输出的特征;通过蒸馏损失函数最小化更新学生模型的参数,训练学生网络;对得到的特征向量进行距离的度量,搜索出相似度最高的行人目标图,最终学生网络resnet18的准确度大幅提升接近到教师网络resnet50的准确度。本发明方法使用知识蒸馏迁移学习的方法实现人员的重识别,通过以小模型代替大模型的思想,有效的降低了计算复杂度,并保证了学生模型的准确度。
技术领域
本发明涉及计算机视觉与图像处理领域,尤其涉及一种基于知识蒸馏的行人重识别方法。
背景技术
人员重新识别的目的是在许多不同的摄像头拍摄的图像库中找到特定的行人。该问题的困难在于以下几方面:不同图片的拍摄视角、行人姿态、光照强度还有遮挡都可能存在较大不同。在行人重新识别模块中,将指定的查询图像与图库中图片进行比较,检索出与查询图为同一个人的图片。为了对图库中图片与查询图片进行对比,系统首先使用手工制作的描述符或深度神经网络提取描述每个图像的特征表示。通常,画廊的特征是事先离线计算并存储的,因此在测试时,我们只需要提取查询图像的特征即可。提取特征后,可以通过计算相似性度量将它们与图库的特征进行比较。
在实际应用场景中,计算资源常常会受到一定限制,必须优化算法运行时的计算成本,并且在降低计算开销的同时算法依然能够保持在一个高的准确率。行人重识别算法主要有基于手工制作特征的方法和深度学习方法两种,基于深度学习的行人重识别方法精度已经远远超过了传统的基于手工制作特征的方法。但深度神经网络运行的计算开销较大,因此我们可以采用基于深度学习的行人重识别方法,并在现有的深度学习方法上降低计算开销,更好的满足实际场景需求。
发明内容
针对现有技术的不足,本发明提供了一种基于知识蒸馏的行人重识别方法,用于解决在现有的深度学习方法上降低计算开销,更好的满足实际场景需求。因此提出了新的知识蒸馏的方法,在更大/更深层网络的支持下训练的较小的模型,使得计算量得到减少,并且能够使小模型实现与深层网络非常相似的准确性。
为解决上述技术问题,本发明的技术方案如下:一种基于知识蒸馏的行人重识别方法,包括以下几个步骤:
步骤1,将行人图像训练集输入到resnet50的PCB作为教师网络,将同样数据集输入resnet18的PCB作为学生网络;
步骤2,通过学生网络转移,特征蒸馏位置,距离损失函数协同作用,在整个骨干网络的多个阶段同时进行蒸馏,使学生网络的特征输出不断接近教师网络输出的特征;
步骤3,通过蒸馏损失函数Ldistill最小化更新学生模型的参数,训练学生网络;
步骤4,对得到的特征向量进行距离的度量,搜索出相似度最高的行人目标图。
作为对上述技术方案的进一步描述:所述步骤1中的教师模型为训练好的模型,且与学生模型完成相同任务的复杂模型,用来辅助训练学生网络;教师网络以骨干网络为resnet50的PCB的网络结构进行训练,学生网络以骨干网络为resnet18的PCB网络,通过蒸馏方法模仿教师进行训练;骨干网络输出的特征图纵向均匀切分成6部分,即6个空间大小4*8张量,然后各自进行全局平均池化,得到6个特征A,在用1×1卷积对特征A进行降为通道数,然后再分别接全连接层和softmax。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011431855.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:外壳按压装置
- 下一篇:动态维度存量管理方法、系统和可读存储介质