[发明专利]一种融合多注意力机制的行人重识别方法在审
申请号: | 202110847407.8 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113705348A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 佟剑瑞;薛峰;费吴俊 | 申请(专利权)人: | 安徽中科有智科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230000 安徽省合肥市包河区花园大*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 注意力 机制 行人 识别 方法 | ||
1.一种融合多注意力机制的行人重识别方法,其特征在于,包括以下几个步骤进行:
步骤1、获取行人重识别数据集Market1501,并对数据集中的每张图片的大小进行归一化、随机裁剪和擦除数据增强,从而得到预处理后的图片集合,构成数据集L;
步骤2、将步骤1中得到的行人图片数据集L划分为训练集和测试集,并将训练集划分为多个批次,每个批次包含P个身份的行人,每个行人含有K张图片,即每个批次包含B张行人图片作为训练样本,其中B = P×K;每个训练样本图片的通道个数为C、高度为H、宽度为W;
步骤3、将训练集与测试集中每个行人图片所对应的真实标签分别记为和;
步骤4、构建融合多注意力机制的行人重识别网络;行人重识别网络将ResNet50模型作为骨干网络,在ResNet50模型的基础上,在其第1个、第2个和第3个残差块之后均加入通道注意力机制,然后在其第4个残差块之后加入空间注意力机制,紧接着在空间注意力机制之后,再加入批正则化,并将全连接层中神经元的个数改为N。
2.根据权利要求1所述的一种融合多注意力机制的行人重识别方法,其特征在于,所述步骤4包括:融入通道注意力机制、融入空间注意力机制、构建特征提取后端网络和进行智能训练;
其中,步骤4.1、融入通道注意力机制;
通道注意力网络CA包括三个支路,第一个支路依次包括:一个全局最大池化层、一个将输入特征通道数缩小r倍的卷积层、一个RELU激活函数以及一个将输入特征通道数增大r倍的卷积层;第二个支路除将全局最大池化层改为全局平均池化层以外,与第一个支路相同;第三个支路为跳跃连接,即输出等于输入;将第一个支路和第二个支路的输出经过逐元素相加后,再经过Sigmoid激活函数得到在通道维度上的权重偏好系数WC,然后将通道维度上的权重偏好系数WC和第三个支路的输出经过逐元素相乘即得到通道注意力模块的输出;
步骤4.2、融入空间注意力机制;
所述空间注意力网络SA包括两个支路,第一个支路依次包括:一个在通道维度上的求均值AVG操作和一个在通道维度上求最大值MAX操作,并将AVG和MAX得到的结果在通道维度上进行拼接,然后通过卷积层融合通道维度上的特征,紧接着通过一个Sigmoid激活函数得到在空间维度上的权重偏好系数WS;第二个支路为跳跃连接,即输出等于输入;将空间维度上的权重偏好系数WS和第二个支路的输出经过逐元素相乘即得到空间注意力模块的输出;
步骤4.3、构建特征提取后端网络;
后端网络包括一个批正则化BN层和一个全连接FC层;后端网络的输入为所述空间注意力网络SA的输出;
步骤4.4、进行智能训练;
以训练集作为所述行人重识别网络的输入,并以与训练集所对应的行人真实标签集合作为标签,采用Triplet Loss和Cross Entropy Loss作为损失函数,利用Adam优化算法对行人重识别网络进行训练,不断优化网络参数,最终得到最优的行人重识别网络,用于实现对从监控视频中截取出的行人进行重识别。
3.根据权利要求2所述的一种融合多注意力机制的行人重识别方法,其特征在于,步骤4.4中,行人真实标签集合和BN层之后得到的特征用于计算Triplet Loss,行人真实标签集合和全连接FC层之后得到的特征用于计算Cross Entropy Loss。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽中科有智科技有限公司,未经安徽中科有智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110847407.8/1.html,转载请声明来源钻瓜专利网。