[发明专利]基于注意力模型的行人属性识别方法有效
申请号: | 202010001740.2 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111199212B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 任劼;胡剑波;章万韩 | 申请(专利权)人: | 西安工程大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/46;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 张皎 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 模型 行人 属性 识别 方法 | ||
1.一种基于注意力模型的行人属性识别方法,其特征在于,具体包括如下步骤:
步骤1:对输入图像进行卷积特征提取,得到特征F;
步骤2:将步骤1中提取的特征送入CBAM模块进行注意力特征提取,得到注意力特征向量F″;
所述步骤2中CBAM是一个结合通道特征以及空间特征的注意力图提取模型,由简称为CAM的通道注意力模块和简称为SAM的空间注意力模块串联而成;
所述步骤2的具体过程如下:
步骤2.1:F通过CAM得到通道注意力图MC(F);
步骤2.2:MC(F)与F进行元素相乘得到通道注意力特征F′;
步骤2.3:F′传入SAM中,得到空间注意力图MS(F′);
步骤2.4:MS(F′)再与F′进行元素相乘,得到注意力特征向量F″;
步骤3:经过Inception网络以及每个Inception网络后的CBAM,得到最终的特征向量,所述步骤3中Inception网络选取Inception-v3作为特征提取的基础网络;
所述步骤3的具体过程如下:
步骤3.1:将步骤2中得到的输出F″输入到Inception网络使用小卷积核进行降维,减少参数的个数;
步骤3.2:将3.1中经过降维的特征输入CBAM模块,进行步骤2中的操作;
步骤3.3:重复上述两个步骤共三次,得到最终的特征向量;
步骤4:对特征向量进行识别进而分类得到识别结果。
2.如权利要求1所述的一种基于注意力模型的行人属性识别方法,其特征在于,所述步骤4的具体过程为:
步骤4.1:将步骤3中得到的特征向量传入简称为GAP的全局平均池化层与简称为FC的全连接;
步骤4.2:对每个特征图进行平均值计算;
步骤4.3:将上一步得到的结果用Softmax进行分类,所述Softmax是一个多分类器,可以计算预测对象属于各个类别的概率,得到该输入的识别结果,其计算公式为:
其中,z是上一层的输出,Softmax分类器的输入,维度为C,yi为预测对象属于第C类的概率。
3.如权利要求1所述的一种基于注意力模型的行人属性识别方法,其特征在于,所述步骤2.1的具体过程为:
CAM将输入分别通过最大池化层和平均池化层,对特征进行空间维度的压缩,然后用Sigmoid函数对其进行归一化,得出通道注意力图MC(F)。
4.如权利要求1所述的一种基于注意力模型的行人属性识别方法,其特征在于,所述步骤2.3的具体过程为:
将F′传入SAM模块中使F′经过最大池化和平均池化操作重新结合,然后经过卷积操作,通过Sigmoid函数进行归一化,得到MS(F′)。
5.如权利要求3-4任一项所述的一种基于注意力模型的行人属性识别方法,其特征在于,所述最大池化操作,即对邻域内特征点取最大,计算公式为:
其中h代表所选池化窗口的高度,w代表池化窗口的宽度,xi,j表示坐标为(i,j)的特征点值;
平均池化操作,对邻域内特征点求平均,计算公式为:
其中h代表所选池化窗口的高度,w代表池化窗口的宽度,xi,j表示坐标为(i,j)的特征点值;
Sigmoid函数可以将输入的数据映射在(0,1)之间,其计算公式为:
其中x为输入的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工程大学,未经西安工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010001740.2/1.html,转载请声明来源钻瓜专利网。