[发明专利]一种基于特征分离和对齐的域自适应无监督目标检测方法在审
申请号: | 202011440101.2 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112488229A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 梁成扬;赵子祥;陈琨;刘军民;张讲社 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 张海平 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 分离 对齐 自适应 监督 目标 检测 方法 | ||
本发明公开了一种基于特征分离和对齐的域自适应无监督目标检测方法,包括以下步骤:将成对的源域和目标域RGB样本输入到两阶段的目标检测框架中,通过源域的标签计算检测损失,训练目标检测框架,获得学习好的目标检测模型;其中,在训练过程中,将多级别的高维特征进行对齐;对每组的区域实例特征进行对齐;将所述成对的源域和目标域RGB样本灰度化并进行特征分离,分离出与检测有关的高维特征及与检测无关的扰乱特征。本发明提供了一种基于特征分离和对齐的无监督域自适应目标检测方法,可有效地解决域自适应目标检测中背景信息噪声和候选区域冗余问题。
技术领域
本发明属于深度学习和目标检测技术领域,特别涉及一种基于特征分离和对齐的域自适应无监督目标检测方法。
背景技术
目标检测是计算机视觉的一个基本问题,它的任务是找出图像上的感兴趣目标,确定它们的位置和类别。在深度卷积网络的推动下,许多基于深度学习的方法被提出来,使得目标检测模型在一些基准自然图像数据集上有很好的性能;但在真实环境中,由于目标的风格、背景等差异,测试集与训练集存在着巨大的领域分布差异,会导致模型在新的领域的泛化能力显著降低。同时,在一些新的领域,如艺术图像等,现有的公开数据集较少,不足以充分训练一个深度目标检测模型。如何提高真实场景和新领域的目标检测模型成为新的挑战,若重新标注新数据集,会耗费大量的人力物力,导致模型成本较高,尤其是目标检测或者分割问题。因此许多无监督域自适应目标检测方法被提出来,用于解决数据分布偏移问题。大多数无监督域自适应目标检测方法是在先进的目标检测框架上,如Faster R-CNN,嵌套对抗训练模块,通过最小化不同层次上的特征图的领域差异,实现源域和目标域的高维特征图分布的对齐,以提高模型在目标域上的泛化能力;例如,图像和实例水平上的对齐(image-level instance-level alignment),强局部和弱全局(Strong-LocalWeak-Global)对齐和局部区域(Local-Region)对齐,上下文感知的实例(Context-AwareInstance-Level)对齐。此外,某些方法还会利用风格迁移方法,如Cycle-GAN,实现像素级别的对齐(pixel-level alignment via style transfer or CycleGAN)。它们提出了域自适应目标检测需要关注图像级别,实例级别,像素级别和局部区域级别的对齐。
上述公开的方法只关注了源域和目标域的映射,并没有充分考虑其它不需要对齐的差异化信息,如背景信息等;在该问题上,应找到图像上需要对齐的目标所在区域,忽略其它与检测无关的背景信息。然而,现有的区域对齐方法存在缺陷,其并没有考虑到图像的目标区域个数不一致问题;其次,对于实例级别,由于目标域数据不存在标签,难以从目标域图像中提取出需要对齐的目标区域特征,候选区域提议网络得到的候选区域可能存在冗余,此外还可能受到背景的影响,以至模型性能不理想。
发明内容
本发明的目的在于提供一种基于特征分离和对齐的域自适应无监督目标检测方法,以解决上述存在的一个或多个技术问题。
为达到上述目的,本发明采用以下技术方案:
本发明的一种基于特征分离和对齐的域自适应无监督目标检测方法,包括以下步骤:
将成对的源域和目标域RGB样本输入到两阶段的目标检测框架中,通过源域的标签计算检测损失,训练目标检测框架,获得学习好的目标检测模型;基于所述学习好的目标检测模型完成目标检测;
其中,在训练过程中,通过目标检测框架中的特征提取网络得到多级别的高维特征,并将多级别的高维特征进行对齐;通过目标检测框架中的区域提议网络,得到候选区域的预测边界框,对得到的预测边界框进行聚类实现区域分组,对每组的区域实例特征进行对齐;
其中,在训练过程中,将所述成对的源域和目标域RGB样本灰度化并进行特征分离,分离出与检测有关的高维特征及与检测无关的扰乱特征;将分离出的两特征合并,进行图像重构,得到源域和目标域的重构灰度图像,使得分离出的特征不偏移原图像本身。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011440101.2/2.html,转载请声明来源钻瓜专利网。