[发明专利]一种基于多尺度深度监督的反向注意力模型在审
申请号: | 202110266638.X | 申请日: | 2021-03-11 |
公开(公告)号: | CN112906623A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 黄德双;吴迪;元昌安;赵仲秋;黄健斌 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 深度 监督 反向 注意力 模型 | ||
1.一种基于多尺度深度监督的反向注意力模型,其特征在于:所述模型包括:输入端、多尺度特征学习模块、注意力机制模块、反向注意力机制模块、深度监督模块、若干个损失函数、若干个平均池化层、若干个线性层和若干个支路;
所述输入端用来输入从若干个行人照片中提取到的不同层级的特征;
所述多尺度特征学习模块用于对所述深度特征进行多尺度学习并进行训练,所述多尺度特征学习模块包括四个阶段:第一阶段、第二阶段、第三阶段和第四阶段,所述四个阶段输入特征组、输出特征图;
所述注意力机制模块用于加强对局部重要特征信息的关注;
所述反向注意力机制模块用于将被所述注意力机制模块抑制的特征变为强调的特征,与所述注意力机制进行互补;
所述深度监督模块用于修正所述注意力机制模块对重要特征关注的准确度;
所述支路包括支路1、支路2、支路3、支路4和支路5;
所述多尺度特征学习模块、所述反向注意力模块、所述平均池化层、所述损失函数依次连接;
所述多尺度特征学习模块的第二阶段通过所述注意力机制模块与所述深度监督模块、所述支路5、所述损失函数依次连接;
所述多尺度特征学习模块的第三阶段通过所述注意力机制模块与所述深度监督模块、所述支路4、所述损失函数依次连接;
所述多尺度特征学习模块的第一阶段、第二阶段、第三阶段、第四阶段、所述平均池化层、支路2依次连接;
所述支路2与所述损失函数直接连接;
所述支路2还通过所述支路3与所述损失函数连接。
2.根据权利要求1所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述多尺度特征学习模块中进行单维度卷积操作。
3.根据权利要求1所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述注意力机制模块包括通道注意力模块和空间注意力模块;其中所述通道注意力模块用于为特征通道输出一组权重值,所述空间注意力模块用于加强对局部重要特征信息的关注,所述通道注意力模块和所述空间注意力模块都是对所述多尺度特征学习模块在每个阶段都输出的特征图进行处理,将所述通道注意力模块与所述空间注意力模块进行融合:
ATT=σ(ATTC×ATTS)
其中ATT为整个注意力机制模块的输出,σ代表Sigmoid函数,ATTC代表通道注意力模块的输出,ATTS代表空间注意力模块的输出。
4.根据权利要求3所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述通道注意力模块包括一个平均池化层以及两个线性层,所述通道注意力模块输出步骤为:所述特征图首先经过所述平均池化层进行全局平均池化操作,再经过两个所述线性层,其中第一个线性层用于降低参数量,第二个线性层用于恢复通道数,经过两个线性层后进行批归一化操作,将输出值范围与通道注意力值范围调整为一致。
5.根据权利要求3所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述空间注意力模块包括两个卷积层和两个降维层,所述空间注意力模块输出步骤为:所述特征图首先经过一个所述降维层进行降维,然后依次输入两个所述卷积层,再进入另一个降维层进一步降维,最后进行所述批归一化操作。
6.根据权利要求1所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述反向注意力机制模块中,将被抑制的特征变为被强调的特征的方法为:通过将各阶段输出的特征与输出点乘,其中所述输出为:
ATTR=1-σ(ATTC×ATTS)
其中ATTR为所述反向注意力机制模块的输出。
7.根据权利要求1所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述深度监督模块还用于在特征学习过程中引入多尺度信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266638.X/1.html,转载请声明来源钻瓜专利网。