[发明专利]图像分类模型的训练方法及分类方法有效
申请号: | 202010013254.2 | 申请日: | 2020-01-07 |
公开(公告)号: | CN111242199B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 夏素缦;程诚;汪浩源;王旭光 | 申请(专利权)人: | 中国科学院苏州纳米技术与纳米仿生研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764 |
代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰 |
地址: | 215123 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 模型 训练 方法 | ||
1.一种图像分类模型的训练方法,其特征在于,所述图像分类模型包括特征提取网络和全连接层,所述训练方法包括:
特征提取网络获取训练样本集的样本特征向量,其中所述训练样本集包括多个不同类样本;
全连接层根据样本特征向量的特征维度N和训练样本集的类别数目C生成与每一类样本一一对应的类别向量;
获取同类样本的样本特征向量和类别向量之间的第一欧式距离,并获取不同类样本的类别向量之间的第二欧式距离;
根据第一欧式距离和第二欧式距离计算样本损失,并根据样本损失更新图像分类模型的参数:
根据损失函数公式计算样本损失,其中所述损失函数的公式为:
其中,Loss表示样本损失,B为一次运算输入的样本数目,C为训练样本集的类别数目,xi表示第i个样本的样本特征向量,yi表示第i个样本的标签,W表示N×C维度的全连接层参数矩阵,Wi表示W的第i个列向量即类别向量,N表示特征维度,λ表示可调参数,为第一欧式距离,为第二欧式距离。
2.根据权利要求1所述的图像分类模型的训练方法,其特征在于,全连接层根据样本特征向量的特征维度N和训练样本集的类别数目C生成与每一类样本一一对应的类别向量的具体方法包括:
根据样本特征向量的特征维度N和训练样本集的类别数目C构建参数矩阵,其中参数矩阵的大小为N*C;
对参数矩阵进行初始化处理,其中初始化处理后的参数矩阵的每一列向量为不同类样本对应的类别向量。
3.根据权利要求1所述的图像分类模型的训练方法,其特征在于,根据样本损失更新图像分类模型的参数的具体方法包括:
根据样本损失计算样本特征向量和类别向量的梯度;
根据梯度更新所述特征提取网络的参数和所述全连接层的参数矩阵。
4.一种图像分类模型的训练装置,其特征在于,所述训练装置包括:
特征提取模块,被配置为利用特征提取网络获取训练样本集的样本特征向量,其中所述训练样本集包括多个不同类样本;
类别特征生成模块,被配置为全连接层根据样本特征向量的特征维度N和训练样本集的类别数目C生成与每一类样本一一对应的类别向量;
距离计算模块,被配置为获取同类样本的样本特征向量和类别向量之间的第一欧式距离,并获取不同类样本的类别向量之间的第二欧式距离;
更新模块,被配置为根据第一欧式距离和第二欧式距离计算样本损失,并根据样本损失更新图像分类模型的参数,所述更新模块包括:
损失函数计算子模块,被配置为根据损失函数公式计算样本损失,其中所述损失函数的公式为:
其中,Loss表示样本损失,B为一次运算输入的样本数目,C为训练样本集的类别数目,xi表示第i个样本的样本特征向量,yi表示第i个样本的标签,W表示N×C维度的全连接层参数矩阵,Wi表示W的第i个列向量即类别向量,N表示特征维度,λ表示可调参数,为第一欧式距离,为第二欧式距离。
5.根据权利要求4所述的图像分类模型的训练装置,其特征在于,所述类别特征生成模块包括:
矩阵构建模块,被配置为根据样本特征向量的特征维度N和训练样本集的类别数目C构建参数矩阵,其中参数矩阵的大小为N*C;
初始化模块,被配置为对参数矩阵进行初始化处理,其中初始化处理后的参数矩阵的每一列向量为不同类样本对应的类别向量。
6.根据权利要求4所述的图像分类模型的训练装置,其特征在于,所述更新模块还包括:
参数更新子模块,被配置为根据样本损失计算样本特征向量和类别向量的梯度,并根据梯度更新所述特征提取网络的参数和所述全连接层的参数矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院苏州纳米技术与纳米仿生研究所,未经中国科学院苏州纳米技术与纳米仿生研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010013254.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序