[发明专利]跨域目标检测模型训练方法、目标检测方法及存储介质在审
申请号: | 202210759090.7 | 申请日: | 2022-06-30 |
公开(公告)号: | CN115115908A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 王晓伟;蒋沛文;王惠;边有钢;秦兆博;秦晓辉;胡满江;秦洪懋;徐彪;谢国涛;丁荣军 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06V10/25;G06V20/70;G06N3/04;G06N3/08 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 胡喜舟 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 方法 存储 介质 | ||
本发明公开了一种跨域目标检测模型训练方法、目标检测方法及存储介质,其中训练方法包括:获取源域带标签图像和目标域无标签图像,构建训练数据集,搭建包括基于对抗训练的跨域目标检测器、感兴趣区域特征提取模块、语义迁移损失计算模块的网络模型,以基于语义迁移损失和基于对抗训练的跨域目标检测损失得到的跨域目标检测总损失为优化目标,基于训练数据集,对构建的网络模型进行训练,得到跨域目标检测模型。本发明在一定程度上消除目标检测在分类边界的语义混淆噪声,有效降低感兴趣区域语义错误匹配的风险,避免某些类别因感兴趣区域数量不足而迁移失败的问题,增强具有相同语义的源域和目标域感兴趣区域特征向量的聚合程度。
技术领域
本发明涉及计算机视觉迁移学习技术领域,尤其涉及一种跨域目标检测模型训练方法、目标检测方法及存储介质。
背景技术
目标检测的主要任务是确定实际应用场景中的感兴趣目标实例的位置和类别。随着深度学习技术的飞速发展,目标检测领域诞生出许多优秀的方法,其可分为两阶段(如,Fast R-CNN、Faster R-CNN、Mask R-CNN等)和单阶段(如,YOLOv3、YOLOv5、SSD、FCOS等)两大类。这些方法在训练数据(称为源域)和应用数据(称为目标域)服从相同概率分布的假设下可以取得优异的检测性能。然而,这一假设在实际应用场景中往往难以成立,数据分布的差异极其容易造成目标检测模型性能的退化,这大大限制了已训练目标检测模型的推广和部署。为了避免昂贵、费时的数据标注工作,无监督域自适应目标检测使用带标签的源域数据和无标签的目标域数据,借助各种域自适应策略来提高目标检测模型的迁移性和泛化性,近年来激发了广大研究者的研究热情和兴趣。
当前大多数无监督域自适应目标检测方法通常采用对抗训练的域自适应策略,在潜在的特征空间中对齐源域和目标域的整体数据分布。这些方法虽然可以在一定程度上缩减域差异,提高模型的跨域检测性能,但是没有考虑目标实例在语义层面的跨域对齐情况。即使能够可靠地定位出目标实例的位置,这些方法也难以对某些目标实例的语义进行准确的分类,比如可能把实际上属于语义A的目标实例归为语义B。由于跨域目标检测往往需要同时对场景中多种类别的目标实例进行检测,因此简单进行对抗训练容易在目标检测的分类边界引入语义混淆的噪声,从而导致次优的域自适应目标检测性能。
针对上述问题,少数无监督域自适应目标检测方法提出了更深层次的域自适应策略,它们往往把感兴趣区域建模为语义特定的原型,随后对源域和目标域中具有相同语义的原型进行对齐。这些方法尽管可以进一步促进跨域目标检测性能的提升,但对于感兴趣区域语义的处理仍不够妥当。由于目标检测模型的训练往往采用小批量随机梯度下降(mini-batch stochastic gradient descent,SGD)算法,因此在某个训练批次中,具有相同语义的感兴趣区域不一定成对出现。比如,源域出现了语义A的目标实例,而在相同批次中,目标域缺少了语义A的目标实例。那么直接拉近原型就会增加感兴趣区域迁移过程中的语义错误对齐的风险,从而损害域自适应目标检测模型的性能。
发明内容
本发明提供了一种跨域目标检测模型训练方法、目标检测方法及存储介质,以解决现有的跨域目标检测方法检测性能不佳的问题。
第一方面,提供了一种跨域目标检测模型训练方法,包括:
获取源域带标签图像和目标域无标签图像,构建训练数据集;
选择基础目标检测器,并在其上设置域分类器,搭建基于对抗训练的跨域目标检测器,并获得基于对抗训练的跨域目标检测损失;
设置感兴趣区域特征提取模块,以获得来自真实标签的源域感兴趣区域特性向量和经过采样得到的目标域感兴趣区域特征向量;
设置语义迁移损失计算模块,以得到由源域感兴趣区域特征向量总加权匹配损失、目标域感兴趣区域特征向量总加权匹配损失和上下文参考损失组成的语义迁移损失;
基于语义迁移损失和基于对抗训练的跨域目标检测损失得到考虑感兴趣区域语义迁移的跨域目标检测总损失;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210759090.7/2.html,转载请声明来源钻瓜专利网。