[发明专利]一种基于多尺度特征动态融合的显著性目标检测方法在审
申请号: | 202110494656.3 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113139544A | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 孙延光;夏晨星;段松松;张海涛 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 232001 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 特征 动态 融合 显著 目标 检测 方法 | ||
1.一种基于多尺度特征动态融合的显著性目标检测方法,其特征在于,该方法包括一下步骤:
1)收集RGB图像数据集,利用VGG-16主干框架提取图像多尺度特征并进行编码;
2)利用多尺度特征动态融合模块优化多尺度特征,生成初始显著性图;
3)利用边缘预测模块从主干网络中低层次的特征生成高质量边缘信息图;
4)初始显著性图与边缘信息图进行高效融合增强显著性目标的边缘信息,生成高性能最终显著性图。
2.根据权利要求1所述的基于多尺度特征动态融合的显著性目标检测方法,其特征在于:所述步骤1)具体方法是:
2.1)收集显著性目标检测领域常用的RGB图像数据集,MSRA-10K数据集、ECSSD数据集、PASCA-S数据集、SOD数据集、THUS数据集。
2.2)将MSRA-10K数据集作为训练数据集,将SOD数据集、ECSSD数据集、PASCA-S数据集、THUS数据集作为测试数据集。
2.3)将预训练好的VGG-16作为主干框架从输入RGB图像数据集提取多尺度特征,然后对多尺度特征进行编码(Conv_1、Conv_2、Conv_3、Conv_4、Conv_5)
3.根据权利要求1所述的基于多尺度特征动态融合的显著性目标检测方法,其特征在于:所述步骤2)具体方法是:
3.1)将多尺度特征输入多尺度特征动态融合模块进行特征融合,通过卷积操作与sigmoid(x)函数生成显著性图利用平均绝对误差(MAE)进行判断,保留最优融合特征。多尺度特征进行动态最优融合生成高质量特征(P1、P2、P3、P4、P5)
其中x,y是像素坐标点的位置,S是生成显著性图,G是真值标签,W,H是显著性图S的长度和宽度。
Pi=θ(ρ(concat(Conv_i,Conv)),w)(i=1,2,3,4,5) (2)
其中θ(x)是卷积核大小是1×1,参数为w的卷积操作,ρ(x)是平均绝对误差判断机制,concat(x)是特征融合操作,Conv除了Conv_i本身的所有多尺度特征。
3.2)步骤3.1中生成的高质量特征P2、P3、P4、P5进行上采样到与P1尺寸相同,然后进行特征融合通过卷积核大小为1×1的卷积操作和sigmoid(x)函数预测初始的显著性图S1;
S1=s(θ(concat(P1,up(P2),up(P3),up(P4),up(P5)),w)) (3)
其中s(x)是sigmoid(x)函数,up(x)是上采样操作,θ(x)是卷积操作,w是卷积操作参数,S1是预测的初始显著性图。
4.根据权利要求1所述的基于多尺度特征动态融合的显著性目标检测方法,其特征在于:所述步骤3)具体方法是:
4.1)将VGG-16主干框架中高层次语义特征(Conv_5)与低层次边缘特征(Conv_1、Conv_2)进行特征相乘,生成特征T1、T2,用作更好地定位显著性目标。
Ti=multi(Conv_i,Conv_5)(i=1,2) (4)
其中multi(x)是特征相称操作。
4.2)将生成的特征T1、T2输入边缘预测模块,然后利用空洞卷积扩张率为(0,2,4)和残差结构提升特征的性能,T2特征通过上采样与T1特征进行融合,通过一个1×1的卷积核和Sigmoid函数生成边缘预测图E。
E=s(θ(concat(τ(T1),up(τ(T2))),w)) (5)
其中s(x)是sigmoid(x)函数,θ(x)是卷积核为1×1,参数为w的卷积操作,concat(x)是特征聚合操作,τ(x)是边缘预测模块。
5.根据权利要求1所述的基于多尺度特征动态融合的显著性目标检测方法,其特征在于:所述步骤4)具体方法是:
5.1)对步骤3.3)和步骤4.2)生成的初始显著性图S1和边缘预测图E进行融合,得到显著性图S2。
S2=s(θ(concat(S1,E),w)) (6)
其中s(x)是sigmoid(x)函数,θ(x)是卷积核为1×1,参数为w的卷积操作,concat(x)是特征聚合操作。
5.2)对于生成的显著性图S2进行自迭代操作,生成最终的显著性图S3。
S3=concat(S2,up(θ1(S2)),up(θ2(S2))) (7)
其中concat(x)为特征聚合操作,θ1(x)卷积核为3×3的卷积操作,θ2(x)卷积核为5×5的卷积操作,up(x)为上采样操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110494656.3/1.html,转载请声明来源钻瓜专利网。