[发明专利]一种基于深度残差网络的视觉显著性检测方法在审
申请号: | 202010389359.8 | 申请日: | 2020-05-10 |
公开(公告)号: | CN111797841A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 朱威;王图强;岑宽;何德峰;郑雅羽 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T7/13;G06F40/30 |
代理公司: | 杭州赛科专利代理事务所(普通合伙) 33230 | 代理人: | 郭薇 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 网络 视觉 显著 检测 方法 | ||
1.一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述方法包括以下步骤:
步骤1:搭建视觉显著性检测神经网络;
步骤2:对神经网络进行训练优化;
步骤3:完成对神经网络的训练;
步骤4:使用训练好的神经网络对输入图像进行检测,输出显著性区域的图像。
2.根据权利要求1所述的一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述步骤1包括以下步骤:
步骤1.1:以深度残差网络为基础网络结构;
步骤1.2:在深度残差网络中配合设置金字塔特征增强模块,输出特征图A1、A2、A3、A4;
步骤1.3:在深度残差网络中配合设置基于空间金字塔池化的语义监督模块,输出特征图C;
步骤1.4:在深度残差网络中增加特征融合模块。
3.根据权利要求2所述的一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述步骤1.2中,金字塔特征增强模块包括低层特征增强子模块、中层特征增强子模块、高层特征增强子模块;低层特征增强子模块采用重叠池化对深度残差网络第一层的输出进行特征提取,选用ReLu为激活函数,输出特征图A1;中层特征增强子模块采用3×3卷积核对深度残差网络第二层的输出进行特征提取,选用ReLu为激活函数,输出特征图A2;高层特征增强子模块先进行重叠池化运算,再采用1×1、3×3、5×5三种不同卷积核对深度残差网络第三层和第四层的输出进行特征提取,选用ReLu为激活函数,分别输出特征图A3和A4。
4.根据权利要求2所述的一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述步骤1.3中,语义监督模块:
采用一个1×1标准卷积和两个3×3的采样率分别为6、12的空洞卷积对深度残差网络的顶层特征进行特征提取,得到三幅特征图;
将得到的三幅特征图采用级联的方式进行合并重组,构成新的特征图,最后采用1×1的卷积核对新的特征图进行卷积,输出特征图C。
5.根据权利要求2所述的一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述步骤1.4中,特征融合模块的融合方法包括以下步骤:
步骤1.4.1:对金字塔特征增强模块输出的四路特征图A1、A2、A3、A4采用大小为1×1的卷积核进行卷积,分别得到特征图B1、B2、B3、B4;
步骤1.4.2:使用双线性插值的上采样方法对语义监督模块输出的特征图C同时进行四次上采样,分别得到四路特征图D1、D2、D3、D4,其中D1和B1、D2和B2、D3和B3、D4和B4的尺寸一致;
步骤1.4.3:若当前特征融合模块位于神经网络的第四层,则将特征图B4与特征图D4通过级联方式进行融合;若当前特征融合模块位于神经网络的其它位置,则将特征图B3、特征图D3与神经网络第三层特征融合模块输出的特征图、或特征图B2、特征图D2与神经网络第二层特征融合模块输出的特征图、或特征图B1、特征图D1与神经网络第一层特征融合模块输出的特征图通过级联方式进行融合;
步骤1.4.4:采用3×3的卷积核对步骤1.4.3融合的结果进行卷积运算,输出特征图。
6.根据权利要求1所述的一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述步骤2中,对神经网络进行训练优化包括设置多路损失函数和数据集增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010389359.8/1.html,转载请声明来源钻瓜专利网。