[发明专利]基于多层次特征与注意力机制的行人再识别方法在审
申请号: | 202111504859.2 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114022906A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 张荣;王进 | 申请(专利权)人: | 南通大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/44;G06V10/764;G06K9/62;G06V10/82 |
代理公司: | 北京科家知识产权代理事务所(普通合伙) 11427 | 代理人: | 曹振中 |
地址: | 226001 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多层次 特征 注意力 机制 行人 识别 方法 | ||
1.一种基于多层次特征与注意力机制的行人再识别方法,其特征在于:包含数据预处理、注意力机制方法及多特征提取,其中所述数据预处理包括随机擦除和随机加噪的数据增强方法;所述注意力机制方法包括通道注意力机制和空间注意力机制两种注意力机制方法,所述多特征提取包括全局特征提取和局部特征提取两个分支特征提取方法。
2.根据权利要求1所述的基于多层次特征与注意力机制的行人再识别方法,其特征在于:在进行随机擦除和随机加噪处理时,对输入的数据集中50%的数据进行处理。
3.根据权利要求1所述的基于多层次特征与注意力机制的行人再识别方法,其特征在于:在数据预处理前准备图像样本集,所述图像样本集为采集的行人图像样本集及Market1501、CUHK03和DukeMTMC-ReID。
4.根据权利要求1所述的基于多层次特征与注意力机制的行人再识别方法,其特征在于:数据预处理完成后,将Resnet50网络作为骨干网络,并且在网络的第四层后添加空间注意力机制和通道注意力机制;所述空间注意力机制的作用是为了寻找网络中最重要的部位进行处理,所述通道注意力机制的作用是通过利用不同通道的重要程度从而有针对性地增强或抑制不同的通道。
5.根据权利要求1所述的基于多层次特征与注意力机制的行人再识别方法,其特征在于:对于全局分支,使用全局平局池化将特征映射转化为全局特征向量,用全局距离计算得到两幅图像的相似度。
6.根据权利要求1所述的基于多层次特征与注意力机制的行人再识别方法,其特征在于:对于局部分支,先采用水平池化将S3中得到的特征映射进行水平池化,得到池化后的特征映射,从而得到局部特征,对得到的局部特征进行局部距离测量,计算局部距离时采用最短距离的方法,得到两张图像的相似度。
7.根据权利要求5所述的基于多层次特征与注意力机制的行人再识别方法,其特征在于:还包括训练模型,所述训练模型使用传统的三元组损失函数计算损失,具体的,采用softmax损失函数和TriHard损失函数训练模型,总的损失函数为:
L=LID+Llocal+Lglobal
其中LID表示全局分支的softmax损失,Lglobal表示全局分支的TriHard损失,Llocal表示局部分支的TriHard损失;采用总的损失函数训练模型,从而得到训练后的行人再识别模型。
8.一种基于多层次特征与注意力机制的行人再识别的模型,其特征在于:使用权利要求1-7任意一项所述的基于多层次特征与注意力机制的行人再识别方法构建得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111504859.2/1.html,转载请声明来源钻瓜专利网。