[发明专利]一种RGB-D图像显著性目标检测方法有效
申请号: | 202110872457.1 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113763422B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 丛润民;杨宁;张晨;张禹墨;赵耀 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/56;G06V10/82;G06N3/0455;G06N3/0464 |
代理公司: | 北京卫平智业专利代理事务所(普通合伙) 11392 | 代理人: | 闫萍 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 rgb 图像 显著 目标 检测 方法 | ||
1.一种RGB-D图像显著性目标检测方法,其特征在于,
所述RGB-D图像显著性目标检测方法基于跨模态差异交互网络;
所述跨模态差异交互网络遵循编码器-解码器架构,实现跨模态信息的差异交互和引导;
所述跨模态差异交互网络包括:RGB图像编码器、深度模态编码器、RGB诱导细节增强模块、深度诱导语义增强模块和密集解码重建结构;
所述RGB图像编码器和深度模态编码器均采用VGG主干网络;
所述VGG主干网络的前两层为:低层级特征编码阶段;
所述VGG主干网络的后三层为:高层级特征编码阶段;
所述RGB-D图像显著性目标检测方法包括以下步骤:
S1、将深度图输入深度模态编码器,将RGB图像输入RGB图像编码器;
S2、所述深度模态编码器提供深度模态,所述RGB图像编码器提供RGB模态;
S3、在低层级特征编码阶段,所述RGB诱导细节增强模块通过将RGB模态的细节补充信息从RGB模态传输到深度模态,以增强和补充深度模态,实现深度特征增强;
S4、在高层级特征编码阶段,所述深度诱导语义增强模块采用注意力级别和特征级别两种交互模式全面进行跨模态特征融合,实现RGB特征增强;
S5、在解码阶段,密集解码重建结构通过结合多层级的编码特征构造语义块,以更新特征解码中的跳连接信息,进行密集解码,进而生成预测的显著性图像。
2.如权利要求1所述的RGB-D图像显著性目标检测方法,其特征在于:所述VGG主干网络为卷积神经网络VGG16。
3.如权利要求2所述的RGB-D图像显著性目标检测方法,其特征在于:步骤S3的具体步骤如下:
S3.1、采用两个级联卷积层融合RGB模态和深度模态的低层级编码特征,生成融合特征池fpool,如式(1)所示,
其中,i为:低层级编码特征的层级,且i∈{1,2};表示:深度模态的低层级编码特征,表示:RGB模态的低层级RGB特征;表示:对和进行通道连接操作;表示:采用卷积核为1×1的卷积层,对进行卷积操作;表示:采用卷积核为3×3的卷积层,对进行卷积操作;深度图经过卷积神经网络VGG16的第一层操作得到RGB图像通过卷积神经网络VGG16的第一层操作得到
S3.2、由获得特征如式(2)所示,
其中,表示:对沿通道维度进行最大池化操作,表示:采用卷积核为7×7的卷积层,对进行卷积操作;表示:采用卷积核为7×7的卷积层,对进行卷积操作;表示:对进行sigmoid函数操作;表示:将和进行逐元素相乘;
经过卷积神经网络VGG16的第二层操作得到同时,通过卷积神经网络VGG16的第二层操作得到进而利用公式(1)和(2)得到特征
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110872457.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清雪车
- 下一篇:一种提纯硫酸亚铁和制备磷酸铁的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序