[发明专利]注意力引导多模态特征融合的图像语义分割方法及装置在审
申请号: | 202111658857.9 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114372986A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 钦闯;邹文斌;田时舜;李霞;邹辉 | 申请(专利权)人: | 深圳大学;慧视创新(深圳)有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06V10/40;G06K9/62;G06V10/80 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 廖厚琪 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力 引导 多模态 特征 融合 图像 语义 分割 方法 装置 | ||
1.一种注意力引导多模态特征融合的图像语义分割方法,应用于包括特征提取网络、多模态特征对齐网络、跨模态特征融合网络以及多层特征融合解码网络的整体神经网络,其特征在于,包括:
通过所述特征提取网络对彩色图以及相应深度图分别进行特征提取处理,得到彩色图特征以及深度图特征;
通过所述多模态特征对齐网络将所述彩色图特征以及所述深度图特征沿通道维度连接之后,进行卷积操作得到混合特征,并基于所述混合特征在通道维度和空间维度上对所述彩色图特征以及所述深度图特征进行对齐,得到对齐后的彩色图特征以及对齐后的深度图特征;
通过所述跨模态特征融合网络分别获取所述对齐后的彩色图特征各个位置点的重要程度的第一权重矩阵,以及所述对齐后的深度图特征各个位置点的重要程度的第二权重矩阵,然后将所述第一权重矩阵与所述对齐后的彩色图特征融合以及将所述第二权重矩阵与所述对齐后的深度图特征融合后再进行叠加处理,得到融合特征;
通过所述多层特征融合解码网络逐层将所述融合特征进行卷积操作以及上采样处理,输出语义分割图。
2.如权利要求1所述的图像语义分割方法,其特征在于,所述基于所述混合特征在通道维度和空间维度上对所述彩色图特征以及所述深度图特征进行对齐,得到对齐后的彩色图特征以及对齐后的深度图特征的步骤,包括:
分别对所述混合特征在水平方向和竖直方向进行全局平均池化,分别得到水平方向上的特征向量以及竖直方向上的特征向量;
将所述水平方向上的特征向量以及所述竖直方向上的特征向量沿通道维度连接,并采用非线性激活函数进行压缩,得到压缩编码后的中间特征图;
基于所述压缩编码后的中间特征图进行特征对齐,得到对齐后的彩色图特征以及对齐后的深度图特征。
3.如权利要求2所述的图像语义分割方法,其特征在于,所述基于所述压缩编码后的中间特征图进行特征对齐,得到对齐后的彩色图特征以及对齐后的深度图特征的步骤,包括:
采用预设的对齐修复算法对所述压缩编码后的中间特征图进行特征对齐,得到对齐后的彩色图特征以及对齐后的深度图特征;
所述对齐修复算法表示为:
其中,X∈RC×H×W、D∈RC×H×W分别表示所述特征提取网络得到所述彩色图特征和所述深度图特征,σ表示sigmoid激活函数,和表示所述压缩编码后的中间特征图沿通道维度分成的两个独立特征图,表示卷积操作,Xrep∈RC×H×W、Drep∈RC×H×W分别表示最终输出的对齐后的彩色图特征以及对齐后的深度图特征。
4.如权利要求1所述的图像语义分割方法,其特征在于,所述通过所述跨模态特征融合网络分别获取所述对齐后的彩色图特征各个位置点的重要程度的第一权重矩阵,以及所述对齐后的深度图特征各个位置点的重要程度的第二权重矩阵的步骤,包括:
通过所述跨模态特征融合网络采用预设的差异性分布学习算法,分别获取所述对齐后的彩色图特征各个位置点的重要程度的第一权重矩阵,以及所述对齐后的深度图特征各个位置点的重要程度的第二权重矩阵;
所述差异性分布学习算法表示为:
其中,Xrep、Drep分别表示所述对齐后的彩色图特征以及所述对齐后的深度图特征,表示卷积操作,||表示沿通道维度连接,δ表示softmax激活函数,GX′∈R1×H×W、GD′∈R1×H×W分别表示所述第一权重矩阵以及所述第二权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学;慧视创新(深圳)有限公司,未经深圳大学;慧视创新(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111658857.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:鱿鱼白片智能切割计算方法、装置、设备及存储介质
- 下一篇:学习数据处理方法