[发明专利]一种轻量级瓶颈注意力机制的深度学习方法在审
申请号: | 202111466243.0 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114118415A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 邓玉辉;李鸿 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄卫萍 |
地址: | 510632 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轻量级 瓶颈 注意力 机制 深度 学习方法 | ||
1.一种轻量级瓶颈注意力机制的深度学习方法,该轻量级瓶颈注意力机制用于嵌入完成图像分类、目标检测和语义分割任务的卷积神经网络,实现图像分类、目标检测和语义分割,其特征在于,所述深度学习方法包括以下步骤:
S1、将前一层卷积神经网络输出的特征图Fin∈RC×H×W输入轻量级瓶颈注意力机制,其中,C表示特征图通道的数量,H和W为特征图的高和宽,上述输出特征图由分类图像、目标检测图像、原始语义数据输入卷积神经网络生成,所述轻量级瓶颈注意力机制包括两个平行的通道注意力分支、空间注意力分支;
S2、所述输出特征图输入通道注意力分支,通过全局平均池化和最大值池化获取中间特征图的空间信息,后使用一维卷积聚合以该通道为中心的左右邻域内的k个通道的信息,将卷积后得到的两个特征图按元素相加,生成通道注意力Mc(F)∈RC×1×1;
S3、所述输出特征图输入空间注意力分支,先使用1×1的卷积进行降维,后使用两个3×3的空洞卷积进行上下文获取,最后使用1×1卷积将通道数压缩到一维,生成空间注意力Ms(F)∈RC×H×W;
S4、融合通道注意力Mc(F)和空间注意力Ms(F),先将通道注意力Mc(F)按空间的两个维度广播扩充成满足C×H×W的维度,然后将空间注意力Ms(F)按通道维度广播扩充成满足C×H×W的维度,最后将扩充后的两个分支按元素相加,并通过Sigmoid函数运算,最后生成轻量级瓶颈注意力Fout∈RC×H×W,该轻量级瓶颈注意力Fout用于实现图像分类、目标检测和语义分割。
2.根据权利要求1所述的一种轻量级瓶颈注意力机制的深度学习方法,其特征在于,所述步骤S2中通道注意力分支的处理过程如下:
S21、使用全局平均池化和最大值池化获取特征图Fin的空间信息,生成两个不同的通道描述符和分别表示最大值池化特征和平均值池化特征;
S22、选择使用卷积核大小为k的一维卷积分别聚合以全局平均池化通道和最大值池化通道该通道为中心的左右邻域内的k个通道的信息;
S23、将卷积后的全局平均池化通道和最大值池化通道描述符相加,生成通道注意力Mc(F)∈RC×1×1,相加计算过程如下:式中表示卷积核大小为k的一维卷积操作。
3.根据权利要求1所述的一种轻量级瓶颈注意力机制的深度学习方法,其特征在于,所述步骤S3中空间注意力分支的处理过程如下:
S31、使用1×1的卷积对前一层卷积神经网络输出的特征图Fin进行降维,得到第一特征图F1∈RC/r×H×W,r为压缩率;
S32、使用两个3×3的空洞卷积对第一特征图F1进行上下文获取,生成第二特征图F2∈RC/r×H×W;
S33、使用1×1卷积,将第二特征图F2的通道数压缩到一维,生成空间注意力Ms(F)∈RC×H×W,计算过程如下其中,和是1×1的卷积,和是卷积核大小为3,空洞率为2的空洞卷积。
4.根据权利要求2所述的一种轻量级瓶颈注意力机制的深度学习方法,其特征在于,k的大小由公式自适应决定,|m|odd表示与m最接近的奇数,C为输入特征图的通道数。
5.根据权利要求2所述的一种轻量级瓶颈注意力机制的深度学习方法,其特征在于,所述步骤S32中空洞卷积的卷积核大小为3,空洞率为2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111466243.0/1.html,转载请声明来源钻瓜专利网。