[发明专利]一种基于多分辨率的图像分类方法有效
申请号: | 201711120584.6 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107967484B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 章东平;倪佩青;胡葵;杨力;张香伟 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F16/583 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 杜立 |
地址: | 315470 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分辨率 图像 分类 方法 | ||
1.一种基于多分辨率的图像分类方法,其特征在于:
步骤1:数据集准备,数据集含N种类别,每类含M种分辨其中W为图片的宽,H为图片的高,M=0,1,2,...n,每种分辨率的图片数量相近,将图片分成训练集和测试集两个部分;
步骤2:制作图片标签,标签表示为l(l∈(1,N)),表示属于第几类,在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同;
步骤3:构建图片数据库,在深度卷积神经网络训练时需要输入训练数据,利用准备好的数据集和标签将图片数据转换为lmdb格式,所述lmdb为内存映射数据库,读取的效率更高,而且支持不同程序同时读取;
步骤4:针对多分辨率输入设计了两种网络结构,确定深度神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数,随机初始化各层的连接权值W和偏置b,给定学习速率η,选定激活函数RELU,选定损失函数Loss,所述激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题,RELU的数学表达式为:
步骤5:训练深度神经网络直到神经网络输出层误差达到精度要求或训练次数达到最大迭代次数,结束训练,保存网络结构和参数,得到训练好的神经网络模型;
步骤6:输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别;
所述步骤4中,第一种深度神经网络结构,采用跳过部分池化层的方法,所述池化层在卷积层后面,通过池化层来降低卷积层输出的特征向量,结构一中跳过池化层的个数取决于输入图片的分辨率大小和最小分辨率的图片大小;
跳过的个数为:
在特征图大小统一前,不同分辨率图片共同作用卷积层和激活层,单独作用池化层,在特征图大小统一后共同作用卷积层、激活层和池化层。
2.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,第二种深度神经网络结构,采用指定位置输入的方法,结构二中不跳过池化层,利用池化层能够降低特征图大小的的性能以2M倍采样特征图,将不同分辨率的图片与不同大小的特征图相匹配,将输入图片定位到大小匹配一致的特征图前一层,所述输入图片在与特征图结合前经过卷积激活处理。
3.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式,利用低层细节更加清楚的特点进行小目标分类,利用高层包含信息更多的特点进行大目标分类,所述小目标与大目标为某一类物体所占图片像素的大小,一张图片中占大部分像素的物体为大目标,反之为小目标,将不同层提取的特征连接得到一个既包含细节又包含总体信息的特征向量;
该向量可用具体公式表示为:
其中RELUj表示深度神经网络的第j个池化层输出,RELUlast表示深度神经网络的最后一个池化层输出;
该向量经过全连接层后输入到softmax层进行类别判断,所述softmax函数是一个归一化的指数函数,可以用于解决多分类问题;
softmax函数定义如下:
yi=ezi/∑nezi i=1,2,3,...,n (4)
其中yi为概率,zi为特征向量z中的第i个元素;
式子中的分母起正则项的作用,∑nezi=1,所述正则项为保留一些更为重要的特征变量,舍弃不需要的变量,该图像分类方法中需要判断输入图片的类别,重点考虑输入图片可能的类别,不考虑概率小的类别;
根据最大化似然函数就是最小化它的负对数的似然函数可得,损失函数为:
Loss=-log(ezi/∑nezi) (5)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711120584.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种近似图像的压缩编码方法
- 下一篇:用电计量设备故障分析方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序