[发明专利]一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法在审
申请号: | 202111565805.7 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114283315A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 段松松;夏晨星;黄荣梅;孙延光 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/46;G06V10/56;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 232001 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交互式 引导 注意力 梯形 金字塔 融合 rgb 显著 目标 检测 方法 | ||
1.一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法,其特征在于,该方法包括一下步骤:
1)获取训练和测试该任务的RGB-D数据集,并定义本发明的算法目标,并确定用于训练和测试算法的训练集和测试集;
2)构建用于提取RGB图像特征RGB编码器和深度(Depth)图像特征Depth编码器;
3)建立跨模态特点融合网络,通过交互式引导的注意力机制指导RGB图像特征和Depth图像特征进行交叉融合;
4)基于上述的跨模态特征融合成的多模态特征,构建超大规模的感受野融合机制,以增强多模态特征的感受野信息和高级语义信息;
5)建立以梯形金字塔特征融合网络为基础的解码器,并通过激活函数得到最终的预测到的显著图;
6)预测出来的显著图Pest与人工标注的显著目标分割图PGT进行损失函数的计算,并通过SGD和反向传播算法逐步更新本发明提出的模型的参数权重,最终确定RGB-D显著性检测算法的结构和参数权重。
7)在步骤6确定模型的结构和参数权重的基础上,对测试集上的RGB-D图像对进行测试,生成显著图Ptest,并使用评价指标进行性能评估。
2.根据权利要求1所述的一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法,其特征在于:所述步骤2)具体方法是:
2.1)将NJUD数据集、NLPR数据集和DUT-RGBD数据集作为训练集,将剩余部分的NLPR数据集、剩余的DUT-RGBD数据集、SIP数据集、STERE数据集和SSD数据集作为测试集。
2.2)RGB-D图像数据集包括单幅RGB图像PRGB、对应的Depth图像PDepth和对应的人工标注的显著目标分割图像PGT。
3.根据权利要求1所述的一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法,其特征在于:所述步骤3)具体方法是:
3.1)利用VGG16作为本发明的模型的主干网络,用于提取RGB图像特征和因对的Depth图像特征,分别为和
3.2)采用在ImageNet数据集上预训练好的VGG16参数权重初始化本发明的用于构建主干网络的VGG16权重。
4.根据权利要求1所述的一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法,其特征在于:所述步骤4)具体方法是:
4.1)跨模态特征融合网络由5个层次的CMAF模块构成,并生成5个层次的多模态特征和
4.2)第i层次的CMAF模块的输入数据为和构成,并通过交互式引导的注意力机制输出第i层次的多模态特征其中i∈{1,2,3,4,5}。
5.根据权利要求1所述的基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法,其特征在于:所述步骤5)具体方法是:
5.1)分别将多尺度的多模态特征通过空洞卷积操作提取超大规模的感受野信息,并设置不同空洞率的空洞卷积:
其中,i∈{1,2,3,4,5}表示多模态特征所在的层次,DLAi()代表空洞率为i的空洞卷积操作,并DLA2()、DLA4()和DLA8()分别代表空洞率为1、2、4和8的空洞卷积操作,和分别代表由第i层次的多模态特征所生成的空洞率为i的特征。
5.2)将上述步骤所生成的多层级感受野的多模态特征输入梯形金字塔特征融合网络,融合不同感受野的多模态特征:
其中,TPNet()表示梯形金字塔特征融合网络。
6)将步骤5所获取到的5个层次的超大规模感受野的多模态特征输入到由梯形金字塔特征融合网络构成的解码器中,得到最终的融合特征,在经过sigmoid函数激活,得到预测的显著图Pest:
Pest=sigmoid(TPNet(f1,f2,f3,f4,f5)) 公式(3)
7)通过本发明预测出来的显著图Pest与人工标注的显著目标分割图PGT进行损失函数的计算,并通过SGD和反向传播算法逐步更新本发明提出的模型的参数权重,最终确定RGB-D显著性检测算法的结构和参数权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111565805.7/1.html,转载请声明来源钻瓜专利网。