[发明专利]一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法在审

专利信息
申请号: 202111565805.7 申请日: 2021-12-17
公开(公告)号: CN114283315A 公开(公告)日: 2022-04-05
发明(设计)人: 段松松;夏晨星;黄荣梅;孙延光 申请(专利权)人: 安徽理工大学
主分类号: G06V10/80 分类号: G06V10/80;G06V10/46;G06V10/56;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 232001 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 交互式 引导 注意力 梯形 金字塔 融合 rgb 显著 目标 检测 方法
【说明书】:

发明属于计算机视觉领域,提供了一种基于交互式引导注意力和梯形金字塔融合的RGB‑D显著性目标检测方法,包括以下步骤:1)获取训练和测试该任务的RGB‑D数据集,并定义本发明的算法目标;2)构建用于提取RGB图像特征RGB编码器和深度(Depth)图像特征Depth编码器;3)建立跨模态特点融合网络,通过交互式引导的注意力机制指导RGB图像特征和Depth图像特征进行交叉融合;4)构建超大规模的感受野融合机制,以增强多模态特征的高级语义信息;5)建立梯形金字塔特征融合网络为基础的解码器以生成显著图Pest;6)预测的显著图Pest与人工标注的显著目标分割图PGT计算损失;7)对测试数据集进行测试,生成显著图Ptest,并使用评价指标进行性能评估。

技术领域:

本发明涉及计算机视觉和图像处理领域,特别地涉及一种基于交互式 引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法。

背景技术:

显著性目标检测旨在通过模拟人类视觉注意机制从给定的数据(如RGB图片、RGB-D图片、视频等)中,定位出最引人注目的目标或者区域。而最近几年,显著性目标检测由于其广泛的应用得到了快速发展,在许多计算机视觉领域得到显著应用,比如图像检索,视频分割,语义分割,视频跟踪,人物重建,缩略图创建和质量评估等等。

由于单一的模态的RGB显著性目标检测算法在面对一些具有挑战性的场景(例如,复杂背景、显著目标与背景高度相似、低对比度场景等等)下,难以准确和完整地从背景中定位出显著目标。因此,为了解决这个问题,将深度(Depth)图像引入到显著性目标检测,通过联合RGB图像和Depth图像相结合构成了RGB-D进行显著性目标检测。

由于Depth Map能够提供许多有用的信息,诸如比如空间结构, 3D分布,目标边缘等信息。将Depth图引入到SOD任务中,能够帮助SOD模型处理诸如复杂背景、低对比度、显著目标与背景外形相似等具有挑战性的场景。因此,如何利用Depth Map辅助 RGB-D显著性目标检测模型精确定位显著目标至关重要。此前的 RGB-D显著性目标检测方法大多将DepthMap作为独立于RGB图像的数据流,单独提取特征,或者将Depth图像作为RGB图像的第四个通道输入进RGB-D显著性检测模型,该类方法无差别地对待RGB图像和Depth图像,忽略了一个事实:RGB图像和Depth图像中,不同区域所携带的显著信息是有着巨大的差异,并且RGB图像和Depth图像对显著目标的信息的表示方面也存在着差异。

考虑到RGB图像数据和Depth图像数据之间存在跨模态数据的二义性问题,本发明尝试探索一种发高效的跨模态特征融合方法,并利用跨模态融合方法有效消除跨模态数据之间的二义性问题。此外,为了进一步探索多尺度特征之间的联系和协作机制,利用多尺度的特征信息有效的提升模型检测的性能,并且可以兼顾高级语义信息和低级的细节信息,从到可以达到感知显著性目标的边缘细节和整体完整性。本发明通过进一步挖掘特征金字塔在多尺度特征融合方面的作用,帮助显著性检测模型更加准确地预测出显著目标。

发明内容:

针对以上提出的问题,本发明提供一种基于交互式引导注意力和梯形金字塔融合的RGB-D显著性目标检测方法,具体采用的技术方案如下:

1.获取训练和测试该任务的RGB-D数据集。

1.1)将NJUD数据集、NLPR数据集和DUT-RGBD数据集作为训练集,将剩余部分的NLPR数据集、剩余的DUT-RGBD数据集、 SIP数据集、STERE数据集和SSD数据集作为测试集。

1.2)RGB-D图像数据集,包括单幅RGB图像PRGB、对应的Depth 图像PDepth和对应的人工标注的显著目标分割图像PGT

2.利用卷积神经网络构建用于提取RGB图像特征和Depth图像特征的显著性目标检测模型网络;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111565805.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top