[发明专利]基于多列卷积神经网络模糊评判的图像识别方法在审

专利信息
申请号: 201610998335.6 申请日: 2016-11-14
公开(公告)号: CN106650786A 公开(公告)日: 2017-05-10
发明(设计)人: 钟玲;张志佳;于雅洁;张兴坤;郭婷;许钟子珩;王艺潭 申请(专利权)人: 沈阳工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 沈阳智龙专利事务所(普通合伙)21115 代理人: 周楠,宋铁军
地址: 110870 辽宁省沈*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于多列卷积神经网络模糊评判的图像识别方法,将图像预处理技术、卷积神经网络和模糊数学方法相结合,针对现实环境中釆集到的图像样本,采用不同预处理技术分别从不同角度克服样本中的干扰信息、增强有利于识别的特征信息,之后把经过预处理的图像输入分别输入针对此种预处理优化后的不同结构的多列卷积神经网络,再对多列卷积神经网络的输出结果采用模糊矩阵进行基于综合隶属度和离散隶属度的模糊评判,确定此类图像适合的模糊评判方式,最后准确的得出识别结果。
搜索关键词: 基于 卷积 神经网络 模糊 评判 图像 识别 方法
【主权项】:
一种基于多列卷积神经网络模糊评判的图像识别方法,其特征在于:步骤如下:(1)选取采集于现实环境的不利于分类的图像,进行预处理,以克服样本中的干扰信息;(2)构建多列卷积神经网络:针对每种预处理,分别构建不同卷积神经网络,获取针对每种预处理的最优网络结构,之后将不同预处理对应的最优卷积神经网络结构进行集成,构建有效利用各种预处理优势的多列卷积神经网络,应用于图像的识别;1)卷积神经网络基本结构包括:(a)卷积层卷积层,又称为特征提取层,是对图像的一个邻域进行卷积得到图像的邻域特征,每个神经元的输入与前一层的局部感受野相连,上层得到的特征图与一个可学习的卷积核进行卷积,然后通过一个激活函数,输出形成这一层的特征图,即提取该局部的特征;该局部特征被提取后,与其它特征间的位置关系也随之确定;对卷积核的确定:对于步骤(1)获得的图像作为输入图像,在输出图像中每一个像素是输入图像中一个小区域中像素的加权处理,其中权值由一个函数即卷积核定义;确定局部感受野:在卷积神经网络中,图像中的小块区域即局部感受野被当作层次结构中的底层的输入数据,信息通过前向传播经过网络中的各个层处理,获得观测数据的显著特征;卷积核提供了一个权重模板,该模板在图像上滑动,并将中心依次与图像中每一个像素对齐,然后对这个模板覆盖的所有像素进行加权,并将结果作为这个卷积核在图像上该点的响应;卷积层中使用的卷积核个数即为该层特征图的数目,也代表提取的特征种类;每一个输出的特征图能与前一层的几个特征图的卷积建立关系;卷积层的加权响应形式如式(1)所示:xjl=f(Σi∈Mjxil-1*kijl+bjl)---(1);]]>其中,l代表层数,k是卷积核,Mj表示选择的输入maps的集合,每个输出图均有一个额外的偏置b;(b)子采样层子采样层是对输入进行抽样操作,又称为特征映射层,使用pooling技术将小邻域内的特征点整合得到新的特征;每个子采样层的特征图数目均与上层相邻的卷积层的特征图数目相同;子采样层的处理形式如式(2)所示:xjl=f(βjldown(xjl-1)+bjl)---(2);]]>其中,down(·)表示子采样函数,对卷积层输出的特征图中不同n*n子块所有的像素进行Pooling操作;(c)采用不同数目及权重的卷积核再进行一次卷积和子采样处理,并将结果输入一个全连接的三层神经网络;(d)权值共享在卷积神经网络中,卷积层的每一个卷积核重复的作用于整个感受野中,对输入图像进行卷积,卷积结果构成了输入图像的特征图,提取出图像的特征;每一个卷积核共享相同的参数,包括相同的权值矩阵和偏置项;2)将每种卷积神经网络集成,构造一种多列卷积神经网络:针对上述每种预处理方法分别构建卷积神经网络,同时在同一预处理方法得到的数据集上构建特征图数和子采样pooling方式不同的不同结构卷积神经网络;通过多列卷积神经网络并行处理,实现对畸变的图像进行快速识别;每次训练开始前,经过不同预处理后的训练集,输入到不同的卷积神经网络进行训练,进而构成多列卷积神经网络MCCNN;输入图像被n个预处理器P0~~Pn‑1进行预处理,多个的CNN并行对输入图像进行训练;MCCNN将在不同预处理样本上训练的CNN组合在一起,然后对输出结果进行模糊评判,以提高识别结果;每一个CNN是在经典的卷积神经网络的基础上进行修改与调整,包括1)修改局部感受野和卷积核的大小;2)修改子采样窗口大小;3)修改批量样本数;4)修改特征图数目;(3)对多列卷积神经网络输出采用模糊矩阵进行综合评判:1)将模糊数学的思想引入到多列卷积神经网络的输出分类中,将每幅图像在每列卷积神经网络上的输出向量作为隶属向量,再将多个隶属向量组成模糊判决矩阵,计算该图片被分为不同类的隶属度;对论域X,A:X→[0,1],则称A是X上模糊集,称为x属于A的隶属度;一个对象在一列卷积神经网络的输出层各神经元的输出构成一个对各目标类的隶属向量:Ai(Cj)=[Ai(c1),Ai(c2),…,Ai(ck)]             (3);其中,Ai(c1)…Ai(ck)为第i个对象在c1…ck类判别神经元上的输出所对应的隶属度;一幅样本图片经多列卷积神经网络处理后的输出构成一个隶属矩阵:其中,n为多列卷积神经网络的列数,k为目标判决类的数目;由隶属矩阵,定义某张图片对某一判决类的模糊隶属度为:Ai(k)ck=Σi=1nAi(ck)n---(5);]]>其中n为多列卷积神经网络的列数,按照最大隶属度原则,得出样本i的最终分类;2)定义综合隶属度与离散隶属度根据隶属向量与判决矩阵的相关公式,样本图片被一个神经网络识别时,此神经网络中输出神经元对应的值组成了隶属向量,而多个神经网络的输出端隶属向量则构成了判决矩阵;综合隶属度是将判别矩阵中每列的值分别进行求和,根据公式(5)计算出图片对该类的综合模糊隶属度,结果最大的数值对应的类别,即为该样本图片被划分的类别;与综合隶属度不同的是,离散隶属度的模糊隶属向量并不是由神经网络的输出神经元的值直接组成,而是将样本在输出神经元中所属类别的值置为1,其余置为0,将重新变换后的输出作为隶属向量,进而组成新的判决矩阵;计算出图片对该类的离散模糊隶属度,结果最大的数值对应的类别,即为该样本图片被划分的类别;对多列输出结果分别应用综合隶属度和离散隶属度评判,对比不同评判方式的正确率,确定此类图像适合的模糊评判方式,最后得出识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610998335.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top