[发明专利]一种基于卷积神经网络的显著物体检测方法有效
申请号: | 201810634717.X | 申请日: | 2018-06-20 |
公开(公告)号: | CN109165660B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 陈舒涵;谭秀莉;王奔;胡学龙 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 孟睿 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 显著 物体 检测 方法 | ||
1.一种基于卷积神经网络的显著物体检测方法,其特征在于,具体步骤为:
步骤1、构建基于卷积神经网络的显著物体检测模型,具体为:在VGG-16的基础上,增加全局显著性估计模块以及残差特征学习模型,其中,所述全局显著性估计模块用于确定待检测图像的全局显著性概率图S6,且该全局显著性概率图的分辨率为输入图像的1/32;所述残差特征学习模型用于获取分辨率逐渐增加的显著性概率图;
所述步骤1中残差特征学习模型获取分辨率逐渐增加的显著性概率图的具体方法为:
11)采用反卷积层deconv将显著性概率图Si+1上采样两倍至VGG-16中第i个模块的卷积特征大小,得到显著性概率图i为VGG-16的模块索引;
12)在VGG-16第i个模块的最后一个卷积层后依次增加反向注意力机制模块以及三个卷积层,所述三个卷积层卷积参数依次为:{64,3×3}、{64,3×3}、{1,3×3},且前两个卷积层后都附有一个非线性激活层ReLU,最后一个卷积层的输出记为残差特征图Ri;
13)将上采样两倍得到的显著性概率图与残差特征图Ri相加得到显著性概率图Si,具体计算公式为:
步骤2、模型训练,将待检测图像输入至构建的网络模型,得到不同分辨率的显著性概率图S6-S1,将显著性概率图S6-S2上采样至原图像大小得到显著性概率图使用交叉熵损失函数计算各个显著性概率图和真实标注图之间的误差,并将误差进行反向传递以更新整个网络模型参数;
步骤3、模型检测,将待检测图像直接输入到更新后的网络模型中预测其对应的显著性概率图,并将预测的显著性概率图S1通过一个sigmoid层归一化到[0,1]后作为最终输出的显著性图。
2.根据权利要求1所述的基于卷积神经网络的显著物体检测方法,其特征在于,步骤1中增加全局显著性估计模块的具体方法为:
移除VGG-16网络最后的三个全连接层,在移除后的网络最后增加4个卷积层conv,卷积参数依次为:{256,1×1}、{256,5×5}、{256,5×5}、{1,1×1},其中{n,k×k}的n表示卷积通道数,k表示卷积核的大小,中间两个卷积层后都附有一个非线性激活层ReLU。
3.根据权利要求1所述的基于卷积神经网络的显著物体检测方法,其特征在于,步骤1中全局显著性估计模块的工作过程具体为:采用显著物体检测或眼动点预测方法得到待检测图像的显著性图,然后将其缩小32倍得到待检测图像的全局显著性概率图。
4.根据权利要求1所述的基于卷积神经网络的显著物体检测方法,其特征在于,步骤12)中增加的反向注意力机制模块的具体工作过程为:
步骤12-1)将上采样两倍得到的显著性概率图通过一个sigmoid层归一化到[0,1],然后与1相减得到反向权重图Wi:
步骤12-2)将反向权重图Wi与VGG-16中第i个模块最后一个卷积层的每一通道分别相乘,得到加权后的特征,计算公式为:
其中,Fi和分别表示加权前后的特征,⊙表示矩阵点乘,j表示卷积特征的通道索引;
步骤12-3)加权之后再增加一个卷积层,卷积参数为:{64,1×1},该卷积层的输出即为反向注意力机制模块的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810634717.X/1.html,转载请声明来源钻瓜专利网。