[发明专利]一种基于迁移学习的图像分类模型的训练方法在审
申请号: | 202211315590.8 | 申请日: | 2022-10-26 |
公开(公告)号: | CN115690534A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 陈益强;马媛;谷洋;文世杰;郭帅 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 图像 分类 模型 训练 方法 | ||
一种图像分类模型的训练方法,所述图像分类模型通过特征提取器提取样本对应的样本特征并通过分类器根据样本特征对样本进行分类,所述方法包括:S1、获取初始的训练集,其包括来自多个源域的样本及指示每个样本所属源域的域属性以及所属类别的标签,其中,所述样本为图像,各源域的标签空间相同,一种标签对应一个子域;S2、利用初始的训练集训练特征提取器提取样本特征,并基于第一损失函数计算的损失值更新特征提取器的参数,所述第一损失函数被配置为基于域属性和标签惩罚不同源域的同一子域的样本对应的样本特征之间的差异;S3、对初始的训练集中的样本进行增强处理以添加所述多个源域之外的增强样本,利用样本及其增强样本对特征提取器和两个分类器进行对抗训练。
技术领域
本发明涉及计算机视觉范畴,具体来说,涉及机器学习中的图像分类技术领域,更具体地说,涉及一种基于迁移学习的图像分类模型的训练方法。
背景技术
传统机器学习尤其是图像分类模型中的最基本假设是训练数据(源域)和测试数据(目标域)之间是独立同分布的,在这个假设下,通过最小化训练数据的误差来优化模型在测试数据的性能。然而,在新环境下采集的目标域数据通常与源域的数据的分布并不相同。具体来说,图像分类模型在面对与训练分布无关的数据时,例如,当将不同视角和光照条件下的真实产品图像作为测试,在干净的产品图像上训练的模型,如果使用以最小化源域经验损失[1]的传统机器学习方法,会表现出较差的性能。
而迁移学习是缓解目标域分布差异的重要方法,迁移学习通过现有的包含较多标签的源域数据对模型进行训练来实现对标签未知或标签较少的目标域的正确识别。在实际应用中,训练用的带有标签的数据集是在不同环境下收集的,而这些不同源域的数据集往往遵循不同的分布,导致单一域的多源域迁移学习没有最大化多源域的信息优势。与此同时,多源域倾向产生一个过拟合模型,使得模型在未知的目标域上的表现不可预测。
领域泛化通常关注训练所使用的源域数据,而领域自适应通常同时关注训练所使用的源域数据以及测试所使用的目标域数据。领域泛化的出现是为了最小化数据集漂移导致的泛化风险,其典型技术特征是学习域不变的表示,从不同源域收集带有不同标签(一种标签即对应一种子域)的数据以获取更多对象的上下文信息,从而学习到不同数据与标签之间不变的关联特征,即本质特征。目前已有的领域自适应方法,例如一种使用域鉴别器的对抗源域对齐方法[2]、一种最大分类器差异源域对齐方法[3],在多源域的泛化问题上都取得了较好的表现,而目前领域泛化的主要做法是以整个源域为单位进行特征分布的对齐(后文简称:一般域对齐或者源域对齐),从而获得域不变特征。以整个源域为单位进行特征分布的对齐(强制的一般域对齐)可能会使模型学习到具有模糊类别分类边界的过压缩域不变特征,不仅存在域不变性,而且来自不同类别的表示也会被混淆,在源域和目标域的性能有待提高。
在领域泛化对抗方法中,例如一种面向域泛化的深度域对抗图像生成方法[4],强制对齐一般域可能会使模型学习到具有模糊类别分类边界的过压缩域不变特征。虽然在领域自适应中,子域对齐通常可以比传统的全域对齐方法获得更好的自适应性能,但是在领域泛化中,由于目标域的信息匮乏,已经证明了一般的域不变特征会增加潜在表示的跨度,特别是对于遥远的目标域;而如果直接采用对齐不同源域的同一子域的样本对应的样本特征(即:同一个类别的样本特征对齐,后面简称子域对齐)的方案,其模型在未知的目标域(特别是与源域的数据分布差距较大的目标域)的性能比源域对齐的方案得到的模型的性能更差,导致在领域泛化中子域对齐很难推广到不可见的目标域。
在例如一种面向域泛化的特征风格化域感知对比学习方法[5]中,使用了对比学习的思想来进行源域的对齐,但同样没有考虑到源域的子域的对齐。
总的来说,现有的域泛化方法在解决例如PACS数据集这类包含多个源域的图像分类问题中,不能有效对齐不同源域所包含的子域的样本特征,并且未知的目标域存在风险,导致分类效果不佳。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211315590.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:三维立体摄影测量装置
- 下一篇:一种有机砜化合物及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序