[发明专利]一种基于卷积神经网络的显著物体检测方法有效
申请号: | 201810634717.X | 申请日: | 2018-06-20 |
公开(公告)号: | CN109165660B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 陈舒涵;谭秀莉;王奔;胡学龙 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 孟睿 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 显著 物体 检测 方法 | ||
本发明提出了一种基于卷积神经网络的显著物体检测方法,本发明以任意的静态图像为输入,输出该图像中显著的物体。本发明首先在卷积神经网络的最深层提取低分辨率的全局显著性图,然后设计了两个网络结构,一个是残差特征学习网络,用于提取多尺度的残差特征,在较少的模型参数下逐步提升全局显著性图的分辨率;另一个是反向注意力机制网络,通过反向权重图引导上述残差特征学习,进一步提升显著性图的分辨率。本发明检测精度高,网络模型小,适用于移动端等嵌入式设备。
技术领域
本发明涉及计算机视觉与数字图像处理领域,具体涉及一种基于卷积神经网络的显著物体检测方法。
背景技术
显著物体检测是指提取图像中引人注目的物体或区域,作为图像预处理步骤,可以广泛地应用于后续的高层图像分析理解任务,如物体识别、语义分割、图像标注等。传统的检测方法大都基于手工设计的视觉特征,如对比度、背景中心差异等,这些特征难以捕获语义信息。随着深度学习的兴起,研究者们将其用于显著物体检测,和传统方法相比,性能得到了大幅地提高。而随着数据规模的爆炸式增长,这类方法还有着巨大的潜力可待挖掘。
目前,在基于深度学习的方法中,基于全卷积神经网络(FCN)的方法是主流,这主要归功于其端到端的处理方式。然而,这些基于FCN的方法仍然存在以下两个弊端:一是由于卷积和池化等操作,使得最后得到预测结果分辨率较低,造成物体边界模糊;二是现有的检测模型存在较大的冗余,模型大小都在100MB以上,从而限制了其在移动端等嵌入式设备中的应用。
发明内容
本发明提出了一种基于卷积神经网络的轻量级显著物体检测方法。
实现本发明的技术解决方案为:一种基于卷积神经网络的显著物体检测方法,具体步骤为:
步骤1、构建基于卷积神经网络的显著物体检测模型,具体为:在VGG-16的基础上,增加全局显著性估计模块以及残差特征学习模型,其中,所述全局显著性估计模块用于确定待检测图像的全局显著性概率图S6,且该全局显著性概率图的分辨率为输入图像的1/32;所述残差特征学习模型用于获取分辨率逐渐增加的显著性概率图;
步骤2、模型训练,将待检测图像输入至构建的网络模型,得到不同分辨率的显著性概率图S6-S1,将显著性概率图S6-S2上采样至原图像大小得到显著性概率图使用交叉熵损失函数计算各个显著性概率图和真实标注图之间的误差,并将误差进行反向传递以更新整个网络模型参数;
步骤3、模型检测,将待检测图像直接输入到更新后的网络模型中预测其对应的显著性概率图,并将预测的显著性概率图S1通过一个sigmoid层归一化到[0,1]后作为最终输出的显著性图。
优选地,步骤1中增加全局显著性估计模块的具体方法为:
移除VGG-16网络最后的三个全连接层,在移除后的网络最后增加4个卷积层conv,卷积参数依次为:{256,1×1}、{256,5×5}、{256,5×5}、{1,1×1},其中{n,k×k}的n表示卷积通道数,k表示卷积核的大小,中间两个卷积层后都附有一个非线性激活层ReLU。
优选地,步骤1中全局显著性估计模块的工作过程具体为:采用显著物体检测或眼动点预测方法得到待检测图像的显著性图,然后将其缩小32倍得到待检测图像的全局显著性概率图。
优选地,步骤1中残差特征学习模型获取分辨率逐渐增加的全局显著性概率图的具体方法为:
11)采用反卷积层deconv将显著性概率图Si+1上采样两倍至VGG-16中第i个模块的卷积特征大小,得到显著性概率图i为VGG-16的模块索引;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810634717.X/2.html,转载请声明来源钻瓜专利网。