[发明专利]一种构建类别中心的图像分类方法有效
申请号: | 201911129753.1 | 申请日: | 2019-11-18 |
公开(公告)号: | CN111079790B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王好谦;刘志宏;张永兵;杨芳 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 类别 中心 图像 分类 方法 | ||
1.一种基于构建类别中心的深度学习图像分类方法,包括如下步骤:
1)输入训练图像,利用多层卷积神经网络提取图像的特征向量,所述图像的特征向量是分布在高维特征空间的高维向量,同时,在所述特征空间构建不同类别的中心向量,所述中心向量和所述图像的特征向量维度一致;
2)计算图像的特征向量和不同类别的中心向量的欧式距离,将距离最小的中心向量的类别作为图像特征向量的类别;
3)根据各类别的中心向量之间的欧式距离计算不同类别图像的特征向量分布的分散程度;假设不同类别的中心向量是ci,i=1,2,…,m,计算出不同类别的中心向量两两之间的欧式距离,表示为Dij,其中i,j=1,2,…,m且i≠j,对每一类中心向量和其最近的中心向量之间的欧式距离求平均值,得到不同类别的分散程度;其中,对于中心ci,计算ci和其他所有中心点的距离,但只保留和其最近的中心点的距离,找到所有的i=1,2,…,m,其中ki的取值满足对求平均,得到分散程度,表示为
4)根据图像的特征向量与各个类别的中心向量之间的欧式距离计算图像属于每一类的概率分数,在概率分数计算中引入余量参数以控制类内距离;
5)在不同类别的图像分类概率分数和分散程度的基础上计算网络损失函数,损失函数的计算包括两部分,即图像特征的分类损失Loss1和各类中心的分散程度Loss2,并利用损失函数对网络参数和类别的中心向量进行学习。
2.如权利要求1所述的图像分类方法,其特征在于,所述步骤1)中,构建的类别中心向量是可训练的参数,利用随机初始化的方法对类别中心向量进行初始化,所述步骤4)中,利用梯度反向传播的方法更新类别中心向量的取值,假设分类类别数是m,将所有的中心向量表示为ci,i=1,2,…,m。
3.如权利要求1或2所述的图像分类方法,其特征在于,所述步骤2)中,将图像特征向量表示为f,图像特征向量和第i类的中心向量的距离为Li,i=1,2,…,m,找出最小的距离Lk,即则图像特征的类别判断为第k类。
4.如权利要求1至2任一项所述的图像分类方法,其特征在于,所述步骤4)中,利用图像的特征向量f和不同类别的中心向量之间的距离Li,i=1,2,…,m计算概率分数,具体方法为:首先将所有的距离归一化,得到相对距离Ri越大表示图像的特征向量和第i类的中心向量的距离越大;为了约束类内距离,在计算概率分数时引入余量;假设图像的特征向量的真实标签是第k类,计算图像的特征向量属于第k类的概率分数为:
其中,e是自然常数,图像的特征向量属于其他类别的概率分数表示为:
概率分数越小,表示图像的特征向量属于相应类的概率越大,m表示余量。
5.如权利要求4所述的图像分类方法,其特征在于,m取值大于1。
6.如权利要求1至2任一项所述的图像分类方法,其特征在于,所述步骤5)中,两个损失函数利用超参λ调整不同约束的权重,即最终的训练损失是:
Loss=Loss1+λLoss2 (3)
分类损失Loss1使用交叉熵进行计算;
利用反向梯度传播的方法更新网络权重和类别的中心向量的取值。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的图像分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911129753.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种资讯推荐方法及装置
- 下一篇:基于热固化机理的3D打印方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序