[发明专利]一种基于迁移学习的图像分类模型的训练方法在审
申请号: | 202211315590.8 | 申请日: | 2022-10-26 |
公开(公告)号: | CN115690534A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 陈益强;马媛;谷洋;文世杰;郭帅 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 图像 分类 模型 训练 方法 | ||
1.一种图像分类模型的训练方法,其特征在于,所述图像分类模型包括特征提取器以及两个分类器,其通过特征提取器提取样本对应的样本特征并通过分类器根据样本特征对样本进行分类,所述方法包括:
S1、获取初始的训练集,其包括来自多个源域的样本及指示每个样本所属源域的域属性以及所属类别的标签,其中,所述样本为图像,各源域的标签空间相同,一种标签对应一个子域;
S2、利用初始的训练集训练特征提取器提取样本特征,并基于第一损失函数计算的损失值更新特征提取器的参数,所述第一损失函数被配置为基于域属性和标签惩罚不同源域的同一子域的样本对应的样本特征之间的差异;
S3、对初始的训练集中的样本进行增强处理以添加所述多个源域之外的增强样本,利用样本及其增强样本对特征提取器和两个分类器进行对抗训练。
2.根据权利要求1所述的方法,其特征在于,所述步骤S3包括:
在对抗训练时,基于第二损失函数计算的损失更新两个分类器的参数,其中,第二损失函数被配置为惩罚每个分类器分类的偏差以及奖励两个分类器对增强样本在每个类别的置信概率差异之和;以及
在对抗训练时,基于第三损失函数计算的损失更新特征提取器的参数,其中,第三损失函数被配置为惩罚每个分类器分类的偏差以及惩罚两个分类器对增强样本在每个类别的置信概率差异之和。
3.根据权利要求2所述的方法,其特征在于,第二损失函数计算的损失被配置为与两个分类器对样本及其增强样本在每个类别的置信概率分别与对应标签之间的偏差正相关以及与两个分类器对增强样本在每个类别的置信概率差异之和负相关。
4.根据权利要求3所述的方法,其特征在于,第二损失函数如下:
其中,表示两个分类器对样本及其增强样本在每个类别的置信概率分别与对应标签之间的偏差的均值,表示两个分类器对增强样本在每个类别的置信概率差异之和的均值,β表示为预设的权重。
5.根据权利要求2所述的方法,其特征在于,第三损失函数计算的损失被配置为与第一损失函数正相关、与每个分类器对样本及其增强样本在每个类别的置信概率分别与对应标签之间的偏差正相关以及与两个分类器对增强样本在每个类别的置信概率差异之和正相关。
6.根据权利要求5所述的方法,其特征在于,第三损失函数如下:
其中,表示第一损失函数,表示两个分类器对样本及其增强样本在每个类别的置信概率分别与对应标签之间的偏差的均值,表示两个分类器对增强样本在每个类别的置信概率差异之和的均值,α表示为预设的权重,μ表示为预设的权重。
7.根据权利要求4或6所述的方法,其特征在于,按照如下方式计算:
其中,2N表示训练时采用的样本或者增强样本的数量,Lce(·)表示分类器输出的置信概率与对应标签之间的交叉熵损失,Gi(·)表示第i个分类器根据样本特征进行分类的置信概率,i=1时表示第1个分类器,i=2时表示第2个分类器,F(·)表示特征提取器提取的样本特征,xm表示样本m,表示样本m对应的增强样本,ym表示样本m对应的标签。
8.根据权利要求4或6所述的方法,其特征在于,按照如下方式计算:
其中,||·||1表示L1距离,M表示训练时采用的增强样本的数量,C表示类别的总数,表示分类器G1预测增强样本属于类别c的置信概率,表示分类器G2预测增强样本属于类别c的置信概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211315590.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:三维立体摄影测量装置
- 下一篇:一种有机砜化合物及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序