[发明专利]一种构建类别中心的图像分类方法有效
申请号: | 201911129753.1 | 申请日: | 2019-11-18 |
公开(公告)号: | CN111079790B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王好谦;刘志宏;张永兵;杨芳 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 类别 中心 图像 分类 方法 | ||
一种构建类别中心的图像分类方法,包括:提取图像特征向量,在特征空间构建类别中心向量;以图像特征向量与类别中心向量之间的欧式距离作为分类依据进行图像特征分类;根据类别中心向量两两之间的欧式距离计算不同类别的分散程度;根据分类结果和不同类别分散程度计算网络的损失函数,利用损失函数对网络参数和中心向量进行学习。本发明的图像分类方法具有控制类内和类间距离的特点,该方法通过直接构建类别中心的方法控制类内和类间距离,使图像特征的分布更加有利于分类,从而取得更好的分类效果。和现有技术对比,利用本发明的方法可以使网络提取的特征具有更好的类内和类间分布特性。
技术领域
本发明涉及计算机视觉和图像处理领域,特别涉及一种图像分类方法。
背景技术
图像分类是传统的计算机视觉问题,图像分类指的是输入一张图片到计算机中,计算机识别图片中物体的类别,例如识别图片中是猫还是狗。图像分类问题在实际场景中有非常多的应用,比如在出入境海关中用到的人脸识别,就需要识别出摄像头中的人脸和数据库中的人脸图片是否属于同一个人。
在深度学习被应用于图像分类之前,传统的图像识别采用模式识别的方法,主要包括图像特征的获取、分类器的训练和图像预测三个部分。图像特征的获取表示从图像中得到可以用于分类器的图像特征,常见的图像特征是高维向量的形式;分类器的输入是图像特征,输出是分类的效果,分类器中含有未知的可训练的参数,利用训练集可以不断优化分类器的参数,训练集包括每一张图像的标签,即图片中物体的类别,训练过程可以使分类器学习训练集中的分类先验信息;当分类器训练好之后,即可输入一张未知标签的图片,通过分类器的计算,输出其类别。
随着硬件资源的发展和算法理论的研究,深度学习开始大量应用于计算机图像的相关问题中,图像特征的提取采用多层卷积神经网络的方法,多层卷积网络中含有大量可训练的参数,这些参数同样依靠训练集进行训练。提取特征之后,需要使用分类器对图像进行分类,深度学习中常使用全连接层和softmax函数对图像特征进行分类,可以计算出特征属于每一类的概率。网络的训练需要损失函数,在分类问题中,最常使用的是交叉熵损失函数。
常见的深度学习图像分类方法提取的特征在高维空间是可分的,但是可能出现类内距离大于类间距离的情况,当给定两个未知分类的图片判断其是否属于同一类时,无法选取有效的判别阈值。现有方法采用全连接层进行分类,本质上是依靠特征在高维空间的模和角度特性。类似地,在高维空间上可以使用欧式距离作为分类的依据,并且基于欧式距离计算网络的损失函数。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本申请的现有技术,在没有明确的证据表明上述内容在本申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
本发明的主要目的在于克服现有技术的缺陷,提供一种基于构建类别中心的深度学习图像分类方法。
为实现上述目的,本发明采用以下技术方案:
一种基于构建类别中心的深度学习图像分类方法,包括如下步骤:
1)输入训练图像,利用多层卷积神经网络提取图像的特征向量,所述图像的特征向量是分布在高维特征空间的高维向量,同时,在所述特征空间构建不同类别的中心向量,所述中心向量和所述图像的特征向量维度一致;
2)计算图像的特征向量和不同类别的中心向量的欧式距离,将距离最小的中心向量的类别作为图像特征向量的类别;
3)根据各类别的中心向量之间的欧式距离计算不同类别图像的特征向量分布的分散程度;
4)根据图像的特征向量与各个类别的中心向量之间的欧式距离计算图像属于每一类的概率分数,在概率分数计算中引入余量参数以控制类内距离;
5)计算网络损失函数,利用反向梯度传播的方法更新网络权重和类别的中心向量的取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911129753.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种资讯推荐方法及装置
- 下一篇:基于热固化机理的3D打印方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序