[发明专利]一种双金字塔结构引导的多粒度行人重识别方法及系统在审
申请号: | 202210118669.5 | 申请日: | 2022-02-08 |
公开(公告)号: | CN114627492A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 熊炜;刘粤;许婷婷;田紫欣;强观臣;陈奕博;万相奎;陈云帆;尚萍萍 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/44;G06K9/62;G06V10/80 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金字塔结构 引导 粒度 行人 识别 方法 系统 | ||
1.一种双金字塔结构引导的多粒度行人重识别方法,其特征在于,包括以下步骤:
步骤1:构建双金字塔结构网络模型;
所述双金字塔结构网络模型,由嵌入注意力金字塔的骨干网络AP-ResNet50、全局分支网络Global Branch和双重注意力特征金字塔分支网络DFP Branch三个部分组成;
所述嵌入注意力金字塔的骨干网络AP-ResNet50,是将APNet注意力金字塔添加到ResNet50的四个残差块之后而构成;
所述全局分支网络Global Branch,由广义平均池化层和归一化处理层构成,其输入为所述嵌入注意力金字塔的骨干网络AP-ResNet50的输出;
所述双重注意力特征金字塔分支网络DFP Branch,其中第一分支由三个conv1 block层和设置与第一个conv1 block层和第二个conv1 block层之间的SA-DAM双重注意力机制层组成,其输入为所述嵌入注意力金字塔的骨干网络AP-ResNet50第二残差块Layer2的输出;其中第二分支由4个conv3 block层组成,其输入为所述嵌入注意力金字塔的骨干网络AP-ResNet50第三残差块Layer3的输出;所述第一分支的输出输入所述第二分支第三个conv3 block层中,所述第二分支输出,将经过广义平均池化层处理后的输出与所述全局分支网络Global Branch中广义平均池化层处理后的输出进行融合操作,从而得到更具鉴别性的多粒度特征;
步骤2:训练所述双金字塔结构网络模型,获得训练好的双金字塔结构网络模型;
步骤3:将待识别图像输入所述训练好的双金字塔结构网络模型,进行多粒度行人重识别。
2.根据权利要求1所述的双金字塔结构引导的多粒度行人重识别方法,其特征在于:步骤1中,所述APNet注意力金字塔,通过“拆分-关注-合并-堆叠”四步操作逐级实现,首先通过骨干网络的残差块提取特征F,再通过注意力金字塔来提取特征F上多尺度的显著区域;拆分操作时以特征图F作为输入,被拆分数在金字塔层中呈指数增长,金字塔层数越高,特征粒度越细;特征图F被拆分成多组子通道注意力后作为通道注意力的输入,来挖掘每个特征张量中具有判别性的信息;再将所有组子注意力模块以拆分操作的逆过程进行合并,从而得到完整且尺度相同的注意力图。
3.根据权利要求1所述的双金字塔结构引导的多粒度行人重识别方法,其特征在于:步骤1中,所述双重注意力特征金字塔分支网络DFP Branch,conv3 block层除采用的是3×3的卷积之外,其余结构与conv1 block层一致。
4.根据权利要求1所述的双金字塔结构引导的多粒度行人重识别方法,其特征在于:步骤1中,所述双重注意力特征金字塔分支网络DFP Branch,第一分支的第一个conv1 block与第三个conv1 block相连;第二分支的第一个conv3 block与第三个conv3 block相连,用于执行下采样操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210118669.5/1.html,转载请声明来源钻瓜专利网。