[发明专利]一种基于无监督域适应的图像自动标注方法在审
申请号: | 202010953059.8 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112149722A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 杨育彬;龙坤 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06T7/11 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 于瀚文;胡建华 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 适应 图像 自动 标注 方法 | ||
1.一种基于无监督域适应的图像自动标注方法,其特征在于,包括如下步骤:
步骤1,获取源域图像和标注,以及目标域图像;
步骤2,搭建检测框架,构建域分类器来抽取全局特征和局部特征;
步骤3,得到训练好的域适应检测模型;
步骤4,用已有的最新模型对测试数据集进行检测,得到初步检测结果;
步骤5,对初步检测结果进行二次处理,提取生成PASCAL VOC格式的xml标注文件;
步骤6,如果xml标注文件数目不够则将已标注好的目标域数据投入原源域中作为新的源域数据进行二次域适应训练。
2.根据权利要求1所述的方法,其特征在于,步骤2包括以下步骤:
步骤2-1,搭建Faster R-CNN框架:输入图片表示为Height×Width×Depth的张量形式,Height、Width、Depth、分别表示高度、宽度、深度,经过预训练CNN卷积神经网络模型的处理,得到卷积特征图conv feature map;然后区域生成网络RPN对提取的卷积特征图进行处理,RPN层用于寻找可能包含对象的预定义的区域即边界框;在获得可能的相关对象和其在原始输入图片中的对应位置后,用CNN模型提取的特征和包含相关对象的边界框,采用感兴趣区域ROI池化处理,并提取相关对象的特征,得到一个新的向量进而计算出区域特征图proposal feature maps,送入后续网络;最后基于R-CNN模块,对边界框内的内容进行分类,并调整边界框坐标;
步骤2-2,构建域分类器:基于步骤2-1的Faster R-CNN框架,在RPN层之前抽取全局特征,在抽取全局特征之前的网络层抽取局部特征,并且依次在高维特征空间使用弱全局对齐,在低维特征空间使用强局部对齐:
在弱全局特征对齐中,域分类器的构建是为了在全局特征对齐中对齐源域和目标域,根据Faster R-CNN框架,使用特征提取器F提取出全局特征向量,网络R将全局特征向量作为输入并且进行初步的检测,i为样例索引值,R(F(xis))为对于源域样例xi的检测结果,yis为样例真实结果,指代检测中包括分类和回归的损失,ns表示源域样例的数目,得到检测损失函数
加入调制因子f(pt)让容易区分的样本产生一个极小的损失:-f(pt)log(pt),其中,d为域标志,如果d=1,即源域,pt=p,否则pt=1-p;
使用损失函数Focal Loss,用FL(pt)表示,γ为控制权重因子,控制难以分类的样本集合的权重,计算公式为:FL(pt)=-f(pt)log(pt),f(pt)=(1-pt)γ,为让目标域样本与源域样本能对齐,f(pt)用另一种形式,为了得到域分类器Dg,弱全局域适应分类器的损失在源域和目标域分别为和联合损失为
从而直接在局部特征上实现对齐;
对于强局部特征对齐:将特征提取器F拆解为F2oF1,F2oF1表示特征提取器F2与特征提取器F1的复合,F1的输出作为局部域分类器Dl的输入,F1输出宽和高分别为W和H的映射,Dl输出一个与输入特征具有同样宽度和高度的域预测图,并利用最小平方损失来训练域分类器,得到源域损失目标域损失联合损失
Dl(Fl(xis))wh指代域分类器在每个位置的输出,损失被设计成让所有特征的接受域与另一个域对齐;
基于上下文的正则化:从源域分类器和目标域分类器的中间层抽取特征向量,所述特征向量因为包含输入图片的信息因此又称为内容向量Context Vector,然后去跟RPN的输出进行拼接,进而预测类别和检测框,所有对抗损失如下:
整个目标定义为最大最小化损失,如下所示:
其中λ是一个权衡参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010953059.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序