[发明专利]一种图像分类方法在审
申请号: | 202110136790.6 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112836629A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 王好谦;刘志宏 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 王震宇 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 | ||
1.一种图像分类方法,其特征在于,包括如下步骤:
1)根据输入图像的类别数量,构建类别中心点,每个类别中心点是一个高维向量,向量的维度和特征的维度相等,中心点的数量等于数据集中类别的数量;
2)使用卷积神经网络作为特征提取模块,对于训练过程的每个随机批次,使用卷积神经网络对每个样本计算特征向量,计算特征向量和类别中心点之间的马氏距离,作为类内距离,根据该类内距离构建分类损失,将分类损失的梯度进行反向传播对卷积神经网络的参数进行更新,使模型朝着类内距离变小的方向优化;
3)对于训练过程中的每个随机批次,根据批次内样本的类别,计算对应的类别中心点之间的距离,作为类间距离,根据该距离构建发散损失,将发散损失的梯度反向传播对类别中心点的参数进行更新,使类别中心点的参数朝着类间距离变大的方向优化;
其中,通过两阶段训练机制,对特征提取模块的权重和类别中心的可训练参数进行交替更新,两个阶段均对马氏距离中的可训练参数更新。
2.如权利要求1所述的图像分类方法,其特征在于,所述两阶段训练机制为,首先对类别中心随机初始化,然后两阶段交替训练过程优化模型参数,两阶段分别是类内优化阶段和类间优化阶段,所述类内优化阶段根据每个随机批次计算出来的分类损失对模型的特征提取模块中的可训练参数进行优化,所述类间优化阶段根据每个随机批次计算出来的发散损失对模型中的类别中心点进行更新,每个阶段均迭代一个和多个随机批次后交替阶段,所述类内优化阶段和所述类间优化阶段均对马氏距离中的参数进行优化。
3.如权利要求1或2所述的图像分类方法,其特征在于,根据每个随机批次里各类别样本点的数量,为每个中心点设置权重,减少类别不平衡的影响。
4.如权利要求1至3任一项所述的图像分类方法,其特征在于,使用难样本挖掘机制,在训练过程中根据样本特征向量和各类别中心点之间的马氏距离确定每个随机批次的难样本,计算难样本损失,增加难样本在损失函数中的权重,促进模型训练。
5.如权利要求1至4任一项所述的图像分类方法,其特征在于,计算马氏距离时,构建参数矩阵K∈Rn×n,向量X,Y∈Rn,向量X和Y的马氏距离D定义如下,其中||·||2表示二范数:
其中矩阵M=KTK,M是一个半正定矩阵,参数矩阵K中的元素均是可训练参数,可以根据损失函数的梯度进行优化。
6.如权利要求5所述的图像分类方法,其特征在于,参数矩阵K采用单位矩阵I初始化,两个向量X和Y之间的马氏距离为以下形式:
D(X,Y)=||K(X-Y)||2=||I(X-Y)||2=||(X-Y)||2 (2)
马氏距离退化为欧氏距离。
7.如权利要求1至6任一项所述的图像分类方法,其特征在于,步骤2)中类内距离计算和分类损失计算包括:对于提取的每个样本的特征f,计算特征和类别中心点之间的马氏距离,类别中心点为集合C=[C1,C2,...,Cm],其中m是数据集的类别数量,特征f的标签是第i类,则类间距离可以表示为:
D(f,Ci)=||K(f-Ci)||2(3)
在使用模型判断样本的分类结果时,保证样本特征和对应类别之间的马氏距离小于样本特征和所有其他类别中心点之间的马氏距离,如式(4):
D(f,Ci)<D(f,Cj),j=1,2,...,m,j≠i(4)
分类损失L1定义如式(5):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110136790.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多光源图片生成方法
- 下一篇:基于CNN的注意力检测系统及方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序