[发明专利]一种开集域自适应图像分类方法及系统有效
申请号: | 202110349864.4 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113076994B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 张庆亮;朱松豪;梁志伟 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06V10/774 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 邵斌 |
地址: | 210012 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 开集域 自适应 图像 分类 方法 系统 | ||
本发明公开了图像识别技术领域的一种开集域自适应图像分类方法及系统,利用通道注意力机制,使网络更好地获取域不变特征,便于特征的迁移,同时使其更容易训练。包括将从源域中获取的带标签样本、从目标域中获取的无标签样本分别输入基于通道注意力模块的特征提取器中,获取加权后的多通道特征图;将加权后的多通道特征图送入标签分类器,将带标签样本划分为K个已知类别,将无标签样本划分为在源域中可见的K个已知类别和在源域中不可见的一个未知类别;将来自源域和目标域的已知类别送入域辨别器,并基于对抗生成网络强化域不变特征提取;基于协方差匹配,缩小源域与目标域之间的域间差异。
技术领域
本发明属于图像识别技术领域,具体涉及一种开集域自适应图像分类方法及系统。
背景技术
近年来,随着深度学习技术的发展,计算机视觉受到广泛的关注,并取得巨大的进步。图像分类作为计算机视觉中的一个经典问题,被广泛应用在我们日常的生产生活中,如医学图像识别,人脸识别,车牌识别,遥感图像分类等方面。目前,传统深度模型主要通过对特定学习场景中的数据进行大量学习来得到。然而,要构建这样一个良好的深度神经网络,往往需要大量带有标签的训练数据。在一些标注稀缺且专业性较强的领域(如医学图像)难以获得。
闭集域自适应是最为基础并备受关注的一类设定,这一类方法最基本的假设是源域和目标域共享完全相同的类别。一旦目标域中含有源域中未出现的类别,这些方法的性能会出现很大的下降。基于开集域的自适应算法。也存在一些问题,如源域和目标域特征未充分对齐,训练容易耦合等问题。此外还有模型训练时间较长,不容易收敛等问题。
发明内容
为解决现有技术中的不足,本发明提供一种开集域自适应图像分类方法及系统,利用通道注意力机制,使网络更好地获取域不变特征,便于特征的迁移,同时使其更容易训练。
为达到上述目的,本发明所采用的技术方案是:
第一方面,提供一种开集域自适应图像分类方法,将采集到的图像输入训练好的开集域自适应图像分类模型,获取图像类别。
进一步地,所述开集域自适应图像分类模型的训练方法,包括:将从源域中获取的带标签样本、从目标域中获取的无标签样本分别输入基于通道注意力模块的特征提取器中,获取加权后的多通道特征图;将加权后的多通道特征图送入标签分类器,将带标签样本划分为K个已知类别,将无标签样本划分为在源域中可见的K个已知类别和在源域中不可见的一个未知类别;将来自源域和目标域的已知类别送入域辨别器,并基于对抗生成网络强化域不变特征提取;基于协方差匹配,缩小源域与目标域之间的域间差异。
进一步地,所述将从源域中获取的带标签样本、从目标域中获取的无标签样本分别输入基于通道注意力模块的特征提取器中,获取加权后的多通道特征图,包括:将带标签样本和无标签样本输入卷积神经网络,经过卷积操作,获得原始多通道特征图;将原始多通道特征图输入通道注意力模块,通过最大池化、平均池化和自调节池化,获得通道信息;将通道信息输入自主学习层,并经Sigmoid操作,获取各通道权重:
ω=Sig{Conv1D[AVGPool(y)]+Conv1D[MAXPool(y)]+Conv1D[AdaPool(y)]} (1)
其中,ω表示通道权值,Sig表示Sigmoid函数,Conv1D表示一维卷积操作, y表示原始多通道特征图,AVGPool表示平均池化,MAXPool表示最大池化, AdaPool表示自调节池化;
基于各通道权重,获得加权后的多通道特征图y'为:
y'=ω*y (1-1)。
进一步地,所述自调节池化使用二维卷积和ReLU激活函数,将二维特征图变换为一个1×1的特征。
进一步地,在所述将带标签样本划分为K个已知类别的过程中,分类损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110349864.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序