[发明专利]一种基于卷积神经网络的显著物体检测方法有效

申请号：	201810634717.X	申请日：	2018-06-20
公开（公告）号：	CN109165660B	公开（公告）日：	2021-11-09
发明（设计）人：	陈舒涵;谭秀莉;王奔;胡学龙	申请（专利权）人：	扬州大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	南京理工大学专利中心 32203	代理人：	孟睿
地址：	225009 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于卷积神经网络显著物体检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于卷积神经网络的显著物体检测方法，其特征在于，具体步骤为：

步骤1、构建基于卷积神经网络的显著物体检测模型，具体为：在VGG-16的基础上，增加全局显著性估计模块以及残差特征学习模型，其中，所述全局显著性估计模块用于确定待检测图像的全局显著性概率图S₆，且该全局显著性概率图的分辨率为输入图像的1/32；所述残差特征学习模型用于获取分辨率逐渐增加的显著性概率图；

所述步骤1中残差特征学习模型获取分辨率逐渐增加的显著性概率图的具体方法为：

11)采用反卷积层deconv将显著性概率图S_i+1上采样两倍至VGG-16中第i个模块的卷积特征大小，得到显著性概率图i为VGG-16的模块索引；

12)在VGG-16第i个模块的最后一个卷积层后依次增加反向注意力机制模块以及三个卷积层，所述三个卷积层卷积参数依次为：{64，3×3}、{64，3×3}、{1，3×3}，且前两个卷积层后都附有一个非线性激活层ReLU，最后一个卷积层的输出记为残差特征图R_i；

13)将上采样两倍得到的显著性概率图与残差特征图R_i相加得到显著性概率图S_i，具体计算公式为：

步骤2、模型训练，将待检测图像输入至构建的网络模型，得到不同分辨率的显著性概率图S₆-S₁，将显著性概率图S₆-S₂上采样至原图像大小得到显著性概率图使用交叉熵损失函数计算各个显著性概率图和真实标注图之间的误差，并将误差进行反向传递以更新整个网络模型参数；

步骤3、模型检测，将待检测图像直接输入到更新后的网络模型中预测其对应的显著性概率图，并将预测的显著性概率图S₁通过一个sigmoid层归一化到[0，1]后作为最终输出的显著性图。

2.根据权利要求1所述的基于卷积神经网络的显著物体检测方法，其特征在于，步骤1中增加全局显著性估计模块的具体方法为：

移除VGG-16网络最后的三个全连接层，在移除后的网络最后增加4个卷积层conv，卷积参数依次为：{256,1×1}、{256,5×5}、{256,5×5}、{1,1×1}，其中{n,k×k}的n表示卷积通道数，k表示卷积核的大小，中间两个卷积层后都附有一个非线性激活层ReLU。

3.根据权利要求1所述的基于卷积神经网络的显著物体检测方法，其特征在于，步骤1中全局显著性估计模块的工作过程具体为：采用显著物体检测或眼动点预测方法得到待检测图像的显著性图，然后将其缩小32倍得到待检测图像的全局显著性概率图。

4.根据权利要求1所述的基于卷积神经网络的显著物体检测方法，其特征在于，步骤12)中增加的反向注意力机制模块的具体工作过程为：

步骤12-1)将上采样两倍得到的显著性概率图通过一个sigmoid层归一化到[0,1]，然后与1相减得到反向权重图W_i：

步骤12-2)将反向权重图W_i与VGG-16中第i个模块最后一个卷积层的每一通道分别相乘，得到加权后的特征，计算公式为：

其中，F_i和分别表示加权前后的特征，⊙表示矩阵点乘，j表示卷积特征的通道索引；

步骤12-3)加权之后再增加一个卷积层，卷积参数为：{64,1×1}，该卷积层的输出即为反向注意力机制模块的输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于扬州大学，未经扬州大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810634717.X/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于超像素分割的车辆颜色识别方法
下一篇：一种空气中过敏原类型的判别方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于卷积神经网络的显著物体检测方法有效

专利文献下载