[发明专利]一种基于无监督域适应的图像自动标注方法在审

申请号：	202010953059.8	申请日：	2020-09-11
公开（公告）号：	CN112149722A	公开（公告）日：	2020-12-29
发明（设计）人：	杨育彬;龙坤	申请（专利权）人：	南京大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08;G06T7/11
代理公司：	江苏圣典律师事务所 32237	代理人：	于瀚文;胡建华
地址：	210023 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于监督适应图像自动标注方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种基于无监督域适应的图像自动标注方法，包括：源域图像及标注的采集，目标域图像的采集；搭建检测框架，构造域分类器抽取全局特征及局部特征；使用Pytorch深度学习框架应用算法对已有数据训练，得到训练好的域适应检测模型；用已有的最新模型对测试数据集(目标域未标注图片)进行检测，得到初步检测结果；利用初步检测结果文件进行二次处理提取生成PASCAL VOC格式的xml标注文件。本发明基于域适应方法，在大量目标域数据未标注的情况下，只需要拥有与其相似的源域图片及标注数据，就可以投入训练进行数据的自动标注。相较于原来的技术，本方法灵活性好、分类精度较高、模型简单且实用性高。

技术领域

本发明涉及机器学习和计算机视觉领域，尤其涉及一种基于无监督域适应的图像自动标注方法。

背景技术

如今深度学习模型都需要在大规模的监督数据集上训练——对于每一个数据，都会有一个与之对应的标签。对于像ImageNet这样包含高到百万级别图片的数据集如果利用人工标注需要很多人花数月的时间完成，假定现在要创建一个有一百万类的数据集，那么就必须给总共1亿帧视频数据集中的每一帧做标注，这基本是无法实现的。无监督学习研究的主要目标就是要训练出能够用于其他任务的模型，这种模型的特点应该尽可能的通用，并且提供尽可能像监督模型一样好的结果。另外，未标注的视频易于以较低的成本收集，因此无监督学习在许多计算机视觉和机器人应用中具有实际的应用价值。

迁移学习就是把已训练好的模型参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务是存在相关性的，所以通过迁移学习可以将已经学到的模型参数通过某种方式来分享给新模型从而加快并优化模型的学习效率。域适应是一种特殊的迁移学习——当源域和目标域的数据分布不同，但两个任务相同时的一种策略，其中实现手段最常见的方法就是学习一个特征转换，使得在转换过的特征空间上，源数据集和目标数据集的分布的区分度达到最小。现实世界中这个问题又分为不同的类型：1)边缘分布相同，条件分布不同且相关。2)边缘分布不同且相关，条件分布相同。3)边缘分布和条件分布都不相同且相关。由此可以考虑在缺少关注数据集的标注时，如何通过寻找一个与关注数据集类似的带有标签的数据集，通过关联训练出一个能以较高精度检测关注数据集对象的模型，然后就能实现标注功能。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于无监督域适应的图像自动标注方法，通过本发明方法构建的图像(视频)标注方法，意在通过自动化的手段，来解决传统人工手动标注问题的时间成本和人力成本耗费巨大的问题，方法主要是涉及到域的分布对齐等。

具体包括以下步骤：

步骤1，获取源域图像和标注，以及目标域图像：源域图像及标注、目标域图像为输入数据，也为训练过程中所必要的数据，并对数据进行调整为PASCAL VOC格式数据，分别储存在两个文件夹(源域数据集文件夹Source，目标域数据集文件夹Target)。

步骤2，搭建检测框架，构建域分类器来抽取全局特征和局部特征。

步骤3，使用Pytorch深度学习框架应用算法思想，得到训练好的域适应检测模型。

步骤4，用已有的最新模型对测试数据集(目标域未标注图片)进行检测，得到初步检测结果。

步骤5，对初步检测结果进行二次处理，提取生成PASCAL VOC格式的xml标注文件；

步骤6，观察生成的标注文件数量，如果xml标注文件数目不够则将已标注好的目标域数据投入原源域中作为新的源域数据进行二次域适应训练。

本发明步骤1包括：

源域一般为开源数据集或者前人工作者保存下来的数据集，一般来说都比较完全，可使用性较高；目标域数据集是关注的要点，目标域数据集只有图片但没有对应的标注数据，得到后将其调整、组织为一般PASCAL VOC数据集形式，分别放在源文件夹和目标文件夹。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010953059.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种高导热高强度铝合金材料及其制备方法和在散热器的应用
下一篇：一种二氧化碳加氢甲烷化反应催化剂及其应用

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于无监督域适应的图像自动标注方法在审

专利文献下载