[发明专利]一种交互循环特征重塑的显著性图像检测方法在审
申请号: | 202011413838.5 | 申请日: | 2020-12-07 |
公开(公告)号: | CN112529862A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 周武杰;郭沁玲;雷景生;万健;钱小鸿;叶宁;甘兴利 | 申请(专利权)人: | 浙江科技学院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T9/00;G06N3/04;G06N3/08;G06T3/40;G06T5/30;G06T5/50 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交互 循环 特征 重塑 显著 图像 检测 方法 | ||
本发明公开了一种交互循环特征重塑的显著性图像检测方法,其在训练阶段构建卷积神经网络,包括输入层、编码部分、解码部分和输出层,编码部分包括神经网络块,解码部分包括信息提取块、特征重塑块、信息重塑块、膨胀卷积块、特征聚合块;将3D图像的RGB图像的三通道及深度图像经处理后得到的三通道深度图输入到卷积神经网络中进行训练,得到显著性检测图;通过计算显著性检测图与标签图像之间的损失函数值,得到最优权值矢量和最优偏置项;在测试阶段将待检测3D图像的RGB图像的三通道及深度图像对应的三通道深度图输入到卷积神经网络训练模型中,利用最优权值矢量和最优偏置项进行预测,得到显著性预测图像;优点是显著性检测结果清晰,检测精度高。
技术领域
本发明涉及一种深度学习的显著性图像检测技术,尤其是涉及一种交互循环特征重塑的显著性图像检测方法。
背景技术
随着人工智能在计算机领域的快速发展,图像的显著性检测已成为越来越受关注的研究领域。显著对象检测(Salient Object Detection,SOD)旨在将视觉上最独特的对象与输入图像区分开来,在过去的几十年中,已经开发了数百种传统的方法来解决突出对象检测的任务,它是许多图像处理和计算机视觉任务中的一个有效的预处理步骤,例如对象分割和跟踪、视频压缩、图像编辑、纹理平滑等。最近的工作是利用卷积神经网络(CNN)来学习检测突出对象的深层特征,这些卷积神经网络模型采用编码解码结构,结构简单,计算效率高。在编码解码结构中,编码器通常利用预先训练的分类模型(例如ResNet和VGG),提取不同语义层次和分辨率的多个特征;解码器将提取的特征组合起来生成显著图。现有的利用卷积神经网络的编码解码结构的显著性检测方法颇有成效,但是,在准确性上仍然存在挑战。例如:不同语义层次和分辨率的特征具有不同的分布特点,高层次特征具有丰富的语义信息,但缺乏准确的位置信息;低层次特征具有丰富的细节,但充满背景噪声,导致融合高层次特征和低层次特征的方法的检测准确性仍不是很理想。对于不同模态的特征来说,RGB信息与深度信息都存在杂乱的背景信息,如何有效区分背景与前景,从而生成更好的显著性图像,仍然需要进一步深入研究。
发明内容
本发明所要解决的技术问题是提供一种交互循环特征重塑的显著性图像检测方法,其显著性检测结果清晰,检测精度高。
本发明解决上述技术问题所采用的技术方案为:一种交互循环特征重塑的显著性图像检测方法,其特征在于包括训练阶段和测试阶段两个过程;
所述的训练阶段过程的具体步骤为:
步骤1_1:选取N对原始3D图像及每对原始3D图像对应的标签图像,将第k对原始3D图像的RGB图像记为将第k对原始3D图像的深度图像记为将第k对原始3D图像对应的真实显著检测图像作为标签图像,并记为然后将所有原始3D图像的RGB图像、深度图像、对应的标签图像构成训练集;其中,N为正整数,N≥200,k为正整数,1≤k≤N,1≤x≤W,1≤y≤H,W表示原始3D图像及其RGB图像、深度图像、对应的标签图像的宽度,H表示原始3D图像及其RGB图像、深度图像、对应的标签图像的高度,表示中坐标位置为(x,y)的像素点的像素值,表示中坐标位置为(x,y)的像素点的像素值,表示中坐标位置为(x,y)的像素点的像素值;
步骤1_2:构建端到端的卷积神经网络:该卷积神经网络包括输入层、编码部分、解码部分和输出层,输入层包括RGB图输入层和深度图输入层,编码部分包括10个神经网络块,解码部分包括2个信息提取块、5个特征重塑块、4个信息重塑块、5个膨胀卷积块、5个特征聚合块;输出层包括输出卷积层,输出卷积层的卷积核大小为3×3、卷积核个数为1、步长为1;
对于输入层中的RGB图输入层,其输入端接收一幅原始RGB图像的R通道分量、G通道分量和B通道分量,其输出端输出原始RGB图像的R通道分量、G通道分量和B通道分量给编码部分;其中,原始RGB图像的宽度为W、高度为H;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011413838.5/2.html,转载请声明来源钻瓜专利网。