[发明专利]一种基于深度卷积网络的显著性目标检测方法有效
申请号: | 201710238210.8 | 申请日: | 2017-04-13 |
公开(公告)号: | CN107423747B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 牛轶峰;马兆伟;王菖;赵哲 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 网络 显著 目标 检测 方法 | ||
1.一种基于深度卷积网络的显著性目标检测方法,其特征在于,步骤为:
(1)网络训练数据构建
根据给定的N张图像数据集及其标定的显著图,从每幅图像和相应的标注图中随机选择n张大小为m×m的图像块Ip,根据图像块对应的显著图块中的黑白像素数目确定其标签值,若白色像素多于黑色像素数目,则对应的标签值为1,否则为0,共构建的训练数据图像块样本集大小为n×N;
(2)数据库预处理
根据构建的训练数据库,需要对于每一个图像块数据Ip的像素进行以下预处理:
其中,Ip_database是构建的整个训练数据库;mean(·)是均值算子;max(·)是最大化算子,寻找最大的像素值;min(·)是最小化算子,寻找最小的像素值;
(3)网络结构设计
深度卷积网络结构的基本运算层主要包括:卷积层、池化层、全连接层,深度网络结构由各个运算层叠加运算组成。网络结构的设计主要对于整个网络中每一层的功能进行定义、每一层中卷积核的尺寸、卷积核的维度、池化层的运算子、降采样的降幅、激活函数类型,其中,卷积运算定义为:
其中,深度网络结构共L层,l∈{1,···L},Il-1表示第l层卷积层的输入数据,Il表示第l层卷积层的输出数据,为卷积核,为偏置项,sigm(·)是sigmoid激活函数,表示卷积操作;
池化层,即降采样层,对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度;一方面进行特征压缩,提取主要特征,其定义为:
其中,是偏置项,downsample(·)表示在的输入图像块中每隔m×m个区域执行一次像素最大化降采样操作,各m×m个区域之间无重叠;
全连接层连接所有的特征,将输出值送给softmax分类器;
(4)网络结构训练
网络前向训练过程主要利用批训练样本,通过卷积、降采样以及单层感知机运算得到相应的网络输出。作为训练过程,网络的输出为对应于训练样本的标签数据。利用深度卷积网络输出与标签数据的差异计算误差函数,并利用误差函数对于每一层的权重系数、偏置因子通过反向传播计算来进行梯度计算,获取权重系数、偏置因子的梯度最优更新值,完成整个深度卷积网络的特征抽取层的权重及末尾单层感知机的权重修改,更新整个深度网络模型。
2.根据权利要求1所述的基于深度卷积网络的显著性目标检测方法,其特征在于,针对所述步骤(3)中的网络结构设计具体操作步骤为:
基于各运算层的定义,所提出设计的深度网络结构主要包括三个卷积层,两个降采样层,以及一个softmax分类层,整个设计的网络结构为I[28×28×3]-C[24×24×20]-P[12×12×20]-C[8×8×50]-P[4×4×50]-FC[500)]-O[1],其中I[·]表示输入层,C[·]表示卷积层,P[·]表示降采样层,FC[·]表示全连接层,O[·]表示输出分类层,括号内参数表示本层数据维数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710238210.8/1.html,转载请声明来源钻瓜专利网。