[发明专利]一种基于注意力特征增强模块的道路目标检测方法在审
申请号: | 202210049982.8 | 申请日: | 2022-01-17 |
公开(公告)号: | CN114419589A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 潘树国;孙迎春;高旺;彭雅慧 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/40;G06V10/776;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 周蔚然 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 特征 增强 模块 道路 目标 检测 方法 | ||
1.一种基于注意力特征增强模块的道路目标检测方法,其特征在于,包括以下步骤:
步骤1、获取待检测道路目标的图像信息;
步骤2、构建卷积神经网络,在所述图像信息中提取表征道路目标的特征,获得不同尺寸的输入特征图;
步骤3、构建注意力特征增强模块,所述注意力特征增强模块包括CBAM注意力机制、语义增强分支,通过注意力特征增强模块对步骤2所得输入特征图进行特征增强,提高任务感兴趣区域的特征表达,获得包含深层语义信息和浅层纹理信息的特征图;
步骤4、基于步骤3所得增强后的特征图,采用解耦输出头进行分类和回归,输出检测结果。
2.根据要求1所述一种基于注意力特征增强模块的道路目标检测方法,其特征在于:步骤3中,所述构建注意力特征增强模块具体步骤包括:
步骤1.3.1、将尺寸大小为原始图像1/32的输入特征图输入到CBAM模块中获得特征图将进行卷积运算、批归一化和激活函数处理后进行上采样,获得尺寸大小为原始图像1/16的语义增强特征图
步骤1.3.2、将尺寸大小为原始图像1/16的输入特征图与语义增强特征图进行加和运算获得特征图将输入到CBAM模块中获得特征图将特征图与特征图在通道维度上进行拼接操作,获得尺寸大小为原始图像1/16的语义增强特征图
步骤1.3.3、将增强特征图输入CSPLayer单元中,将获得的特征图进行卷积运算、批归一化和激活函数处理后进行上采样,获得尺寸大小为原始图像1/8的语义增强特征图
步骤1.3.4、将尺寸大小为原始图像1/8的输入特征图与语义增强特征图进行加和运算获得特征图将输入到CBAM模块中获得特征图将特征图与特征图在通道维度上进行拼接操作,获得尺寸大小为原始图像1/8的语义增强特征图
步骤1.3.5、将增强特征图输入CSPLayer单元中,获得的特征图用于解耦头对目标进行检测。
3.根据权利要求2所述一种基于注意力特征增强模块的道路目标检测方法,其特征在于:步骤1.3.1、步骤1.3.2以及步骤1.3.4所述CBAM模块包括生成通道注意力特征图和空间注意力特征图两个处理步骤:
将输入特征图F进行首先通过全局平均值池化和全局最大值池化操作获取输入特征的空间信息,生成和两个空间上下文描述符;和通过一个含有一个隐藏层的多层感知器生成通道注意力图;当输入特征图的尺寸为通道注意力特征图Mc(F)详细计算公式为:
其中,r表示多层感知器瓶颈结构的缩减值,取值为16;σ(·)代表Sigmoid激活函数;R(·)代表ReLU线性整流函数;g(·)是全局平均值池化函数;δ(·)是全局最大值池化函数;
Sigmoid激活函数σ(·)的计算公式为:
ReLU线性整流函数R(·)的计算公式为:
全局平均值池化函数g(·)的计算公式为:
全局最大值池化函数δ(·)的计算公式为:
在生成空间注意力特征图时,首先沿着通道轴将输入特征图F′进行包含平均值池化和最大值池化的池化操作,并生成和两个二维的特征图;将生成的二维特征图在通道维度进行拼接,并通过标准卷积层进行卷积,生成空间注意力特征图Ms(F′);空间注意力特征图Ms(F′)详细计算公式为:
其中,f7×7其代表卷积核为7×7的卷积操作;
CBAM模块最终输出的注意力特征图化计算公式为:
4.根据权利要求2所述一种基于注意力特征增强模块的道路目标检测方法,其特征在于:步骤1.3.3以及步骤1.3.5所述CSPLayer单元具体步骤包括:
首先将输入特征图F1进行卷积运算、批归一化和激活函数处理,获得特征图F11;
然后将输入特征图F1输入另一个分支,进行卷积运算、批归一化和激活函数处理获得特征图F21,将F21逐次残差瓶颈块中,逐次进行三次运算,获得特征图F22;
最后,将特征图F11与特征图F22在通道维度上进行拼接以获得特征图F31,并将特征图F31进行卷积运算、批归一化和激活函数处理用于后续运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210049982.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钵苗移栽装置
- 下一篇:一种点云数据压缩和解压方法及装置