[发明专利]一种加入Dropout的卷积神经网络的果蔬图像识别方法在审
申请号: | 201710046101.6 | 申请日: | 2017-01-20 |
公开(公告)号: | CN106778701A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 林志贤;叶芸;郭太良;姚剑敏;曾维亮 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350002 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加入 dropout 卷积 神经网络 图像 识别 方法 | ||
技术领域
本发明涉及深度神经网络技术领域,特别是一种加入Dropout的卷积神经网络的果蔬图像识别方法。
背景技术
智能冰箱的果蔬识别可帮助商家收集用户果蔬产品的消耗情况,利用该数据分析出用户喜好,商家可通过终端APP适时向用户做出果蔬产品以及个性化食谱推荐,或提醒用户尽快食用冰箱中即将过期的食品。目前大多数对果蔬图像的识别分类都是基于机器视觉的研究,采用人工提取果蔬颜色,纹理,形状等特征,然后用分类器识别。人工提取特征繁琐,提取到的特征片面,且容易受外界如光照等因素的变化,鲁棒性不强。
鉴于上述原因,本发明提出一种加入Dropout的卷积神经网络的果蔬图像识别方法,卷积神经网络是一类可以直接以2D图像作为输入的深度神经网络,这种自主从隐含层中逐层选取图像物体由边、颜色等低层到角点、形状等高层特征的方式,避免了人工提取特征的繁琐与片面,使网络具有自主选取特征并进行学习与识别的能力。卷积神经网络还具有良好的容错能力,自适应能力强,对特定的遮挡、光照、平移、旋转、缩放及其他形式的扭曲都具有良好的鲁棒性,非常适合用于处理该类果蔬识别问题。
对于传统的卷积神经网络,当需要训练的样本集不大时,容易引起“过拟合”,从而导致识别率降低。
发明内容
有鉴于此,本发明的目的是提出一种加入Dropout的卷积神经网络的果蔬图像识别方法,在隐含层中引入Dropout技术,减少传统卷积神经网络中“过拟合”现象的发生。
本发明采用以下方案实现:一种加入Dropout的卷积神经网络的果蔬图像识别方法,具体包括两层卷积滤波层、两层降采样层、一层全连接层、一层输出层;通过在所述卷积滤波层中加入一定比例的随机隐退Dropout,令某些神经元冻结,使其输出为0,进而减少过拟合现象;包括以下步骤:
步骤S01:将输入图像归一化至网络所需尺寸大小;
步骤S2:进行卷积:用一个可训练的滤波器卷积输入图像,得到卷积层的特征图,其中卷积层中引入Dropout的神经元的比例为30%;
步骤S3:进行降采样:对卷积层的特征图中每个n×n的邻域求平均得到降采样层的一个值,进而使得降采样层的特征图在各个维度都比卷积层的特征图缩小了n倍;
步骤S4:进行全连接:将第二层降采样层的特征图展开成一个向量,乘上加权值并通过激活函数得到输出层神经元的输出值;
步骤S5:求出输出值与标签值的的均方误差,网络采用基于带动量项的梯度下降反向传播算法,当迭代次数满足要求时终止卷积神经网络的训练。
具体可包括以下步骤:
S01:将输入图像归一化至网络所需的尺寸大小;
S02:将所述S01中归一化后的图像通过第一层卷积滤波层得到该层的特征图;
S03:将所述S02中的特征图通过第一层降采样层得到该层的特征图;
S04:将所述S03中的特征图通过第二层卷积滤波层得到该层的特征图;
S05:将所述S04中的特征图通过第二层降采样层得到该层的特征图;
S06:将所述S05中的特征图展开成一个列向量;
S07:将所述S06中向量乘上加权通过一个非线性激活函数进行映射得到输出值;
进一步的,所述网络所需尺寸为1:1的等宽高图像。
进一步的,所述两层卷积滤波层均采用ReLU非线性非饱和函数作为激活函数进行映射得到输出值,加速网络收敛。
进一步的,所述两层降采样层均采用均值采样,即对输入的上一层卷积滤波层的特征图的n×n区域求平均后作为该层的一个点。
进一步的,步骤S5中所述基于带动量项的梯度下降反向传播算法中,采用的权重更新规则为:
ωi+1=ωi+νi+1;
其中,i为迭代次数,η为学习率,λ为权重衰减因子,ω为权重向量,vi表示动量,α为动量项系数;为第i批训练样本Di的损失函数在权值为ωi时关于ω的导数的平均值。
与现有技术相比,本发明有以下有益效果:本发明提出在卷积神经网络中加入Dropout技术,即在隐含层中“冻结”一定比例的神经元,在网络训练过程中保留其当前的权值,同时将输出设定为0,而这些被选择的神经元在下次训练过程中又会恢复之前保留的取值,并再次随机选择部分神经元重复此过程。该方法可减少“过拟合”的发生,提高网络的泛化能力。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710046101.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于変分编码器中国手语识别方法
- 下一篇:指纹识别模组及装置