[发明专利]图像分类模型的训练方法及分类方法有效
申请号: | 202010013254.2 | 申请日: | 2020-01-07 |
公开(公告)号: | CN111242199B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 夏素缦;程诚;汪浩源;王旭光 | 申请(专利权)人: | 中国科学院苏州纳米技术与纳米仿生研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764 |
代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰 |
地址: | 215123 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 模型 训练 方法 | ||
本发明公开了图像分类模型的训练方法及分类方法。该训练方法包括:特征提取网络获取训练样本集的样本特征向量,训练样本集包括多个不同类样本;全连接层根据样本特征向量的特征维度N和训练样本集的类别数目C生成与每一类样本一一对应的类别向量;获取同类样本的样本特征向量和类别向量之间的第一欧式距离,并获取不同类样本的类别向量之间的第二欧式距离;根据第一欧式距离和第二欧式距离计算样本损失,并根据样本损失更新图像分类模型的参数。本申请的训练方法可使得同类样本之间更加靠近,不同类样本之间更加远离,同时本申请在训练过程每个类别所需求的数据量少,每个类别的区分度更高,从而提高了模型的识别准确率。
技术领域
本发明属于计算机视觉和图像处理技术领域,具体地讲,涉及一种图像分类模型的训练方法以及分类方法和训练装置、计算机可读存储介质、计算机设备。
背景技术
随着大数据时代的来临,图像识别技术的应用场景也越来越广泛,而损失函数softmax loss也因为其易于优化、收敛快等特征广泛应用于图像识别的学习网络中。现有的softmax loss所用的全连接层通常是计算样本与全连接层各个类别向量之间的距离,包括计算余弦距离和计算欧式距离。此时深度学习网络的训练目标就是让样本图像的特征与全连接层标签方向的类别向量距离尽量近,而与全连接层其他方向的类别向量距离尽量远。在训练数据足够的情况下,这种全连接层计算方式与softmax loss结合可以训练出精度足够高的图像识别模型。
现有技术最大的缺点是对数据的需求极大,在某个图像的数据较少时无法得出该图像有效的信息。例如,某一类的图像数量特别多,那么训练完成的模型对该类图像的识别率较准确,另外一类的图像数量特别少,那么训练完成的模型对该类图像的识别率较低。实际情况中,数据不均衡是客观存在的,因此对于本领域技术人员来说,如何利用不均衡的数据训练得到对各个类别图像的识别率都较高的模型是急需解决的技术问题。
发明内容
(一)本发明所要解决的技术问题
本发明解决的技术问题是:如何提高图像分类模型的识别准确率。
(二)本发明所采用的技术方案
一种图像分类模型的训练方法,所述图像分类模型包括特征提取网络和全连接层,所述训练方法包括:
特征提取网络获取训练样本集的样本特征向量,其中所述训练样本集包括多个不同类样本;
全连接层根据样本特征向量的特征维度N和训练样本集的类别数目C生成与每一类样本一一对应的类别向量;
获取同类样本的样本特征向量和类别向量之间的第一欧式距离,并获取不同类样本的类别向量之间的第二欧式距离;
根据第一欧式距离和第二欧式距离计算样本损失,并根据样本损失更新图像分类模型的参数。
优选地,全连接层根据样本特征向量的特征维度N和训练样本集的类别数目C生成与每一类样本一一对应的类别向量的具体方法包括:
根据样本特征向量的特征维度N和训练样本集的类别数目C构建参数矩阵,其中参数矩阵的大小为N*C;
对参数矩阵进行初始化处理,其中初始化处理后的参数矩阵的每一列向量为不同类样本对应的类别向量。
优选地,根据第一欧式距离和第二欧式距离计算样本损失的具体方法为:
根据损失函数公式计算样本损失,其中所述损失函数的公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院苏州纳米技术与纳米仿生研究所,未经中国科学院苏州纳米技术与纳米仿生研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010013254.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序