[发明专利]基于稀疏性随机池化的卷积神经网络的图像识别方法在审

申请号：	201710172260.0	申请日：	2017-03-22
公开（公告）号：	CN107871136A	公开（公告）日：	2018-04-03
发明（设计）人：	宋振华;刘焱;杨建勇;蒋乐伦;宋嵘;张超;蒋庆	申请（专利权）人：	中山大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	东莞市奥丰知识产权代理事务所(普通合伙)44424	代理人：	吴若草
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于稀疏随机卷积神经网络图像识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种基于稀疏性随机池化的卷积神经网络的图像识别方法。

背景技术

图像识别是计算机视觉技术领域的核心分支，它集成了数字图像处理、模式识别和机器学习等学科知识，是图像检索、人脸识别、人机交互和智能视频监控等应用技术的基础。图像特征表达是图像识别研究的关键点，也是难点所在。所述图像特征表达是指：结合用户使用的场景，能够将图片中的主体信息从复杂的背景条件下准确地识别和提取出来，并使用当前人工智能领域较为先进的深度学习技术对获取到的图片信息进行训练分析，最终可以进行大数据分析和处理，形成以图像元素为核心的智能数据库，在国家安全、交通、互联网、医学影像等诸多领域具有广泛的应用前景。

卷积神经网络(Convolutional Neural Network)是由LeCun等提出的一种用于字体图像识别的前馈神经网络模型，它的神经元可以相应部分覆盖图像上一定范围内的周围单元，对大型图像的处理有着极佳的表现，已经广泛用于图像识别领域。卷积神经网络实质上是一种有监督的深度学习算法，通过局部感受野与权值共享，通过卷积核运算直接对二维图形进行特征提取并训练分类。卷积神经网络的基本架构是由一系列交迭相连的卷积层、池化层和非线性层以及全连接的输出层组成，采用反向传播算法对卷积神经网络中的权值参数逐层反向调整，通过不断的迭代训练次数使系统的误差不断降低，提高卷积神经网络的精度，最终得到卷积神经网络权值参数的最优解。其中池化层对上一层的特征通过人为设定的池化窗口大小以及步长进行池化计算，目的是减小特征的维度，并且使特征进一步聚合。现有池化方法最常用的是最大值池化算法和均值池化算法，其中基于最大值池化算法运用较为广泛，它是一种有效的提取特征算法，能够提取图像的纹理特征，但是却忽略了图像的背景的信息特征，且容易使训练的模型过拟合，这样将会导致模型在新样本上的识别效果变差。

发明内容

为了解决现有技术中存在的问题，本发明提出了一种基于稀疏性随机池化卷积神经网络的图像识别方法。

本发明所述基于稀疏性随机池化卷积神经网络的图像识别方法是通过以下技术方案来实现的：所述基于稀疏性随机池化卷积神经网络的图像识别方法，包括如下步骤：

1)构建图像样本集，包括训练集与测试集以及每张图像对应的标签集，其中设定好图像每一类别在分类器中的编码方式；

2)搭建卷积神经网络框架，包括特征提取框架与训练分类框架，特征提取阶段由多个卷积层与池化层交迭进行，训练分类阶段由全连接层与分类器层构成，用于将前端提取的图像特征经由全连阶层并以向量形式输入分类器；

3)训练过程中设置超参数，构造代价函数，利用BP算法每次根据最小批次的误差反向更新网络的权重；所述超参数包括学习率参数、Dropout层、带momentum的SGD、ReLu激活函数等；所述构造代价函数，即计算所得值与目标标签值的误差函数；然后利用BP算法每次根据最小批次的误差反向更新网络的权重；

4)图像输入识别模型的卷积层进行特征提取，输出特征图并连接下一个神经元作为新的输入数据进行操作，每个神经元只对图像的局部区域进行感知，两个相邻滑动窗口之间的距离称为步长，每个特征图谱上所有节点具有权重共享特性；

5)在卷积神经网络结构中的池化层采用稀疏随机池化操作，池化策略是根据池化区域的稀疏程度来动态得到该区域的最佳特征值，并通过该最佳特征值利用高斯分布以最佳特征值为中央分配区域其余激活值的权重，最后通过带权重的随机取值作为池化的输出值；

6)图像数据前向传播经过卷积层、池化层、非线性层和全连接层最后连接softmax分类器，计算交叉熵代价函数，并使用随机梯度下降法反向传播逐层调整权重减小误差；

7)重复步骤6)，经由网络的输入端到输出端不断的训练调整，使代价函数不断收敛，直至达到设定的训练次数或测试集上准确率不再提升则终止训练，获得CNN图像识别模型；

8)如图3(b)所示，使用训练好的网络对新的图像样本进行识别，得到最终分类结果。

本发明的有益效果是，本发明采用了基于稀疏性随机池化的卷积神经网络来提取图像特征并用于训练分类，针对池化区域进行判别，选取出最佳值作为区域的表征，并对该区域进行权重分配随机取值。这样不仅能够使卷积层得到的特征得到更好的特征表达效果，而且使模型在训练中一定程度上避免陷入局部最小值，增强了识别模型的泛化性与识别精度。

附图说明

图1为常规池化算法示意图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710172260.0/2.html，转载请声明来源钻瓜专利网。

上一篇：用于确定人的姿势平衡的方法和系统
下一篇：一种广告服务商评价系统及其评价方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于稀疏性随机池化的卷积神经网络的图像识别方法在审

专利文献下载