[发明专利]一种基于网络增长和逼近论的图像分类方法在审
申请号: | 202210202362.3 | 申请日: | 2022-03-03 |
公开(公告)号: | CN114565796A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 刘波;张翔宇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/06;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 增长 逼近 图像 分类 方法 | ||
1.一种基于网络增长和逼近论的图像分类方法,其特征在于结合逼近论和集成学习的思想,通过增长神经网络规模的方式逐步学习图像数据集的特征,并根据每次增长后的神经网络对图像的分类误差逐步调整对图像特征的学习程度,最终完成对图像的正确分类,方法具体包括以下步骤:
步骤1:图像数据集处理:将图像数据集降维转化成向量数据集;
步骤2:样本空间划分:对降维得到的向量数据集形成的样本空间进行划分,得到不同的超立方体,每一超立方体设定一个区域标签;
步骤3:确定基础神经元单元cell,训练过程中,基础神经元单元cell的结构不变,参数随输入自适应变化;
步骤4:将步骤3中的基础神经元单元cell进行堆叠形成自适应网络,其中,cell堆叠的层数等于三倍样本空间划分数目,每个堆叠层中包含的cell个数等于降维后的输入向量的维数;
步骤5:增长网络完成图像分类。
2.根据权利要求1所述的一种基于网络增长和逼近论的图像分类方法,其特征在于:
步骤1中图像数据集S是由输入的m个图像形成的,每张图像为灰度图像或者RGB三通道图像,图像数据为特征向量、单通道像素矩阵或三通道像素矩阵,对应图像真实分类标签为y1,y2,…,ym;
步骤1中所述的图像数据集处理具体为:若输入图像数据集为特征向量数据集,则无需进行降维;否则,将数据集中的每个图像从单通道或者三通道像素矩阵降维成n维向量,n的取值由降维方法确定;将降维后的向量形成的数据集T作为之后的输入数据集,分类标签不变,来进行后续的网络搭建和增长。
3.根据权利要求1所述的一种基于网络增长和逼近论的图像分类方法,其特征在于:
步骤2中所述的样本空间划分,对降维后的m个n维向量数据集T形成的样本空间A进行划分,划分目的是将类别标签相同的向量划分到同一超立方体中,之后神经网络即可从学习图像特征转移到学习样本空间区域特征;划分后的每一块超立方体Xc都设定一个类别标签Yc,设定标准是将超立方体中所有向量的类别标签中出现次数最多的类别标签设定为超立方体的类别标签Yc;保存样本空间划分方法和超立方体类别标签作为样本空间划分信息。
4.根据权利要求1所述的一种基于网络增长和逼近论的图像分类方法,其特征在于:
步骤3中所述的基础神经元单元cell采用单隐层的resnet网络,具体结构为三层神经网络,依次包括输入层、隐藏层以及输出层,隐藏层激活函数为ReLU函数,在输入层和输出层之间存在一个skip-connect,输入层和隐藏层,以及隐藏层和输出层之间的连接均采用线性连接,即隐藏层元素=权值×输入层元素+偏置,输出层元素=权值×隐藏层元素+偏置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210202362.3/1.html,转载请声明来源钻瓜专利网。