[发明专利]一种基于不确定性引导的自适应跨域目标检测方法有效
申请号: | 202110764822.7 | 申请日: | 2021-07-06 |
公开(公告)号: | CN113392933B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 蔡敏捷;罗敏怡 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/766;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市深软翰琪知识产权代理有限公司 44380 | 代理人: | 吴雅丽 |
地址: | 410000 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 不确定性 引导 自适应 目标 检测 方法 | ||
1.一种基于不确定性引导的自适应跨域目标检测方法,其特征在于,包括以下步骤:
S1.目标检测模型的预训练:使用带标签的源域的训练数据、不带标签的目标域的训练数据,对目标检测模型进行训练和跨域的特征对齐;
S2.针对目标域数据的随机前向预测:使用目标检测模型对目标域数据进行多次随机前向预测;
S3.计算目标检测每个实例的平均类别概率、位置,以及平均类别概率、位置对应的不确定性,得到每个候选框的类别不确定性和位置不确定性;
步骤S3的具体步骤如下:
给定一个候选框b,基于步骤S2得到的多次预测结果,利用下式计算它的平均类别概率和位置
θt~dropout(θ) (3)
T代表步骤S2中的随机前向预测的次数,t是次数的索引,θt是使用dropout对预训练模型θ进行采样得到的模型参数;Ccls,Creg分别代表模型的分类和回归模块;
采用基于贝叶斯神经网络的不确定性估计方法,得到类别的不确定性uc和位置的不确定性ul;
其中,gt∈Rn是分类模块Ccls的一个关于类别的n维预测输出,是gt的转置向量,lt=(u,v,w,h)是回归模块Creg的一个关于实例边界框中心坐标(u,v)及其宽度和高度(w,h)的四维预测输出,是lt的转置向量;
S4.图像伪标签的选择:利用不确定性感知的伪标签选择算法,将图像选取部分实例预测结果作为伪标签,并作为步骤S5中模型自训练的伪标签;
S5.不确定性引导的模型自训练:基于步骤S3所得结果,以及步骤S4所得伪标签,对图像目标检测模型进行自训练,更新模型参数,使得模型更加适用于目标域数据;
步骤S5的具体步骤如下:
基于步骤S3和步骤S4得到的平均类别预测位置预测不确定性uc,ul和伪标签利用公式(7)对模型进行自训练,从而达到更新模型参数的目的,使得模型更加适用于目标域的数据;
公式(7)中第一项为带标签的源域图像的训练损失,第二项为带伪标签的目标域图像的训练损失,具体计算方式如公式(8)所以;
式(8)中,是目标检测实例级的分类和回归损失,pi是模型对候选框生成网络(RPN)生成的最终预测结果,是其对应的伪标签,则是伪标签的不确定性感知权重,由类别不确定性uc和位置不确定性ul按公式(9)计算得到;
所述图像目标检测模型为Faster R-CNN全卷积神经网络模型,使用的损失函数是交叉熵函数和平滑L1范式。
2.根据权利要求1所述基于不确定性引导的自适应跨域目标检测方法,其特征在于,步骤S1中,所述目标检测模型为带有丢弃正则化的全卷积神经网络。
3.根据权利要求1所述基于不确定性引导的自适应跨域目标检测方法,其特征在于,步骤S1中,所述跨域的特征对齐基于对抗思想,使用梯度反转层将源域的训练数据与目标域的训练数据在特征空间进行对齐。
4.根据权利要求1所述基于不确定性引导的自适应跨域目标检测方法,其特征在于,步骤S2中,所述随机前向预测即在模型预测时开启dropout功能,使得每次预测使用不同的模型参数,从而得到不同的预测结果,模型的直接预测结果是目标检测实例类别概率和位置。
5.根据权利要求1所述基于不确定性引导的自适应跨域目标检测方法,其特征在于,步骤S4中,利用不确定性感知的伪标签选择算法,为图像选取部分实例预测结果作为伪标签并作为下一步模型自训练的伪标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110764822.7/1.html,转载请声明来源钻瓜专利网。