[发明专利]一种基于注意力机制的跨域行人重识别方法有效
申请号: | 202110417945.3 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113158881B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 殷光强;贾召钱;王文超;候少麒;王治国 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06T3/40 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 邓小兵 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 行人 识别 方法 | ||
1.一种基于注意力机制的跨域行人重识别方法,其技术方案为:在基于ResNet50构造的神经网络模型中对输入图像进行特征提取和抑制背景干扰,具体包括如下步骤:
步骤1:对输入图像进行卷积和池化处理,提取输入图像的特征数据;
步骤2:将特征数据输入到第一残差块中进行处理得到第一输出特征x1,使用残差连接的Instance Normalization层对第一输出特征x1进行归一化处理并得到归一化的特征f1,使用空间注意力模块提取出第一个注意力权重w1,再根据第一个注意力权重w1与使用残差连接得到的特征A得出第二输入特征i1;
步骤3:将第二输入特征i1输入到第二残差块中进行处理得到第二输出特征x2,使用残差连接的Instance Normalization层对第二输出特征x2进行归一化处理并得到归一化的特征f2,使用空间注意力模块提取出第二个注意力权重w2,使用注意力权重融合模块将第二个注意力权重w2与第一个注意力权重w1进行融合得到第一融合权重w12,再根据第一融合权重w12与使用残差连接得到的特征B得出第三输入特征i2;
步骤4:将第三输入特征i2输入到第三残差块中进行处理得到第三输出特征x3,使用残差连接的Instance Normalization层对第三输出特征x3进行归一化处理,使用空间注意力模块提取出第三个注意力权重w3,使用注意力权重融合模块将第三个注意力权重w3与第一融合权重w12进行融合得到第二融合权重w23,再根据第二融合权重w23与使用残差连接得到的特征C得出第四输入特征i3;
步骤5:将第四输入特征i3输入到第四残差块中进行处理,得到第四输出特征,再将第四输出特征输入到Head层中处理,处理后即得到抑制了背景干扰的行人特征;
设定空间注意力模块的输入特征为f∈Rc*h*w,提取出对应的注意力权重为w∈R1*h*w,c、h、w分别为输入特征f的通道数、高度和宽度,则使用空间注意力模块提取出注意力权重的方法如下:
S1:沿通道维度分别计算输入特征f的最大值和平均值,生成两个2D特征图;
S2:将生成的两个2D特征图分别沿h维度和w维度计算对应的最大值和平均值,共得到8个特征向量;
S3:将8个特征向量两两组合进行矩阵乘法并进行softmax操作得到4个空间注意力掩码,softmax使得每个掩码内部数值和为1,增加了行人区域和背景区域的注意力权重差异,然后在通道维度上将4个空间注意力掩码进行拼接;
S5:通过3x3卷积和sigmoid将拼接得到的注意力掩码进行融合,融合后得到最终的空间注意力权重为w∈R1*h*w;
步骤3中,使用注意力权重融合模块进行融合的方法为:
先将第二个注意力权重w2进行上采样并与第一个注意力权重w1按通道维度进行拼接,同时保留高层的语义信息和低层的位置信息,再利用卷积操作对拼接后的特征进行融合和下采样,最后将下采样后的特征与第二个注意力权重w2进行逐元素相加,即得到融合后的第一融合权重w12,计算公式如下:
w12=(ds(cat(us(w2),w1))+w2)/2
其中,us(·)代表双线性插值上采样,ds(·)代表通过卷积核大小为3×3,步长为2的卷积操作进行下采样,cat(·)代表按通道维度进行拼接操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110417945.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型阻尼可调黏滞阻尼器
- 下一篇:一种基于多属性特征的文章推荐方法