[发明专利]一种基于计算机模式识别的并行卷积神经网络方法在审
申请号: | 201711492094.9 | 申请日: | 2017-12-30 |
公开(公告)号: | CN107886165A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 李玉鑑;方皓达 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 计算机 模式识别 并行 卷积 神经网络 方法 | ||
1.一种基于计算机模式识别的并行卷积神经网络方法,其特征在于:本方法由图像数据集和并行卷积神经网络组成;图像数据集由互联网下载的各个图像分类数据构成,并行卷积神经网络是改进的深层卷积网络;
基于计算机模式识别的并行卷积神经网络方法包括三个阶段:
图像分类数据收集阶段:从互联网下载相关图像分类数据形成图像数据集集dataset0,得到图像分类数据集dataset0以后,把图像分类数据集dataset0按照4:1的比例分为图像训练数据集train_dataset和图像测试数据集test_dataset;
并行卷积神经网络构建阶段:根据深层卷积神经网络模型model0,对model0进行并行化改造,并行卷积神经网络含有两个输入入口input_1和input_2,并行卷积神经网络由若干卷积层conv和池化层pool以及全连接层fc构成,在全连接层之前将并行结构的卷积层conv进行级联concatenate,最后加入全连接层进行分类;将并行卷积网络结构定义为model1;
在卷积神经网络中,卷积层的每一个卷积核作用于图像数据集中没幅图像中,对图像数据集的每一幅输入的图像进行卷积操作;卷积结果构成了输入图像的特征图,提取出图像的局部特征;每一个卷积滤波器共享相同的参数,包括相同的权重矩阵和偏置项;
同图像尺度不变特征变换提取一样,CNN的结构中也有降采样层;降采样层是一种非线性降采样方法;考虑到卷积层输出的原始图像的特征图仍然包含大量数据,若直接训练,则很难训练出一个有效的分类器;通过降采样操作,将特征数据大大减少,并且其对旋转、尺度和缩放具有不变性,同时还减少计算的复杂度;降采样方法是一种高效的降低数据维度的采样方法;在图像识别中,降采样的操作分为两类:最大值和平均值;降采样模板取2×2,即取2x2大小图像块的四个像素值中的最大值或平均值为降采样后的像素值;经过降采样后,图像的大小变为原来的1/4,达到降维的作用;
深度卷积神经网络分类阶段:采用标准正交分布orthonormal去初始化构建的并行卷积神经网络model,并用并行网络去做图像分类工作;用图像分类数据集中的训练集train_dataset去训练并行卷积网络,然后用测试集test_dataset去测试训练好的并行卷积网络的效果,得到分类的准确率。
2.根据权利要求1所述的一种基于计算机模式识别的并行卷积神经网络方法,其特征在于:图像分类数据集选择cifar-10小物体图像分类数据集;Cifar-10由60000张32*32的RGB彩色图片构成,共10个分类;这个数据集最大的特点在于将识别、分类任务迁移到了普适物体;
步骤1:下载好cifar-10小物体数据集,存入硬盘中以便于后续使用;
步骤2:对cifar-10数据集中训练集和测试集的标签进行类别化,转换为one-hot向量,以便神经网络更好的识别;
步骤3:构建并行卷积网络结构;
步骤4:并行网络结构中的激活函数选择relu即非线性激活单元,并加入dropout层用于防止过拟合,dropout率为0.25;
步骤5:采用学习速率为0.0001的adam优化器优化神经网络;
步骤6:将训练与测试图像矩阵数据转换为0-1之间的数以便于神经网络更快的收敛
步骤7:对构建好的并行卷积神经网络进行标准正交初始化以便于神经网络更快速的收敛;
步骤8:将下载好的cifar-10数据集中的训练集送入神经网络进行训练;
步骤9:将cifar-10数据集中的测试集送入训练好的神经网络模型进行分类测试,输出并行卷积神经网络分类准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711492094.9/1.html,转载请声明来源钻瓜专利网。