[发明专利]一种基于三元组和差额度量的域自适应方法在审
申请号: | 202110220887.5 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112819098A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 胡海峰;杨岩;吴建盛;朱燕翔 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三元 差额 度量 自适应 方法 | ||
本发明提供了一种基于三元组和差额度量的域自适应方法,从目标域随机抽取样本,形成目标域batch,输入特征提取器获得样本特征;将样本特征输入至多分类器,进行熵最小化处理;同时输入至多二分类器,根据输出确定k个临界样本以及k对相似类;然后利用三元组损失triplet loss筛选有效样本构建源域batch,通过提取好的源域batch样本训练多二分类器和多分类器;最后将目标域batch和源域batch送入域对抗网络,进行域对齐操作;本发明通过使用三元组损失函数,并且合理设计该损失中正负样本对之间的差额margin,利用域对抗网络进行域对齐,使得源域和目标域的样本分布趋于一致,间接地让目标域靠近分类边界的样本远离边界,以使得能够将目标域靠近分类边界的样本进行正确分类。
技术领域
本发明涉及机器学习技术领域,主要涉及一种基于三元组和差额度量的域自适应方法。
背景技术
随着机器学习的不断发展,尤其是其子领域深度学习的发展,很多的机器学习任务和计算机视觉应用程序在性能方面都得到了极大的提升,然而,这也是有前提的,我们必须要有足够多的有标签数据来支撑我们,根据这些有标签数据能帮助我们训练出一个有效的模型来解决一些实际的问题。但是在实际的场景中,大量的有标签数据是很难获取到的,这要花费大量的人力和物力,因此怎样找到一个有效的方法,来解决标签数据缺失的问题就显得尤为关键。
在标签数据缺失的情况下,域自适应方法是一个比较合理的解决途径。域自适应是迁移学习的一个分支内容,其目的是希望我们能够借助源域丰富的有标签数据训练出一个有效的模型,并且能将这个模型有效的运用到目标域,目标域中的数据没有标签或者少量数据含有标签。同时,我们还需要注意的是,源域和目标域必须具有相同的类别空间和学习任务。
域自适应主要解决的是如何减小源域和目标域样本分布之间的差异,在此基础上提出了很多域自适应方法,现如今具有代表性的方法很多都是对抗性域自适应方法,这些方法是借鉴了生成对抗网络(GAN,Generative Adversarial Networks),的基本思想,目的都是让源域和目标域的样本分布趋于一致,使得源域训练出的模型能够很好地应用到目标域中。但是,这些基于域对抗思想的方法都没有能够很好地解决目标域相似类样本接近的问题,这些相似类样本在特征空间中非常接近两类的分类边界,这就使得在判别的过程中非常容易将一些目标域样本误判为与其相似的类别。现有技术中对于基于域对抗思想的域自适应方法如何有效解决目标域相似类样本的判别问题尚没有公开的披露。
发明内容
发明目的:本发明提供了一种基于三元组和差额度量的域自适应方法,通过使用三元组损失函数triplet loss,并且合理设计该损失中正负样本对之间的差额margin,在特征空间中将源域相同类样本之间的距离拉近,不同类样本之间的距离拉远,再通过利用域对抗网络(DANN,Domain-Adversarial Neural Network)进行域对齐,使得源域和目标域的样本分布趋于一致,间接地让目标域靠近分类边界的样本远离边界,以使得能够将目标域靠近分类边界的样本进行正确分类。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于三元组和差额度量的域自适应方法,包括以下步骤:
步骤S1、从目标域随机抽取样本,形成目标域batch,将所述目标域batch输入特征提取器获得样本特征;将样本特征输入至多分类器,进行熵最小化处理;同时将样本特征输入至多二分类器,依据多二分类器的输出判定k个临界样本和对应的k对相似类,计算出对应的k个正负样本对间的差额margin;
步骤S2、根据步骤S1中在目标域batch中找到的k对相似类,通过三元组损失triplet loss在源域的k对相似类样本中筛选有效样本,构建源域batch;
步骤S3、将构建的源域batch输入至特征提取器进行特征提取,将提取出的特征分别输入至多分类器和多二分类器,基于分类信息训练特征提取器、多分类器和多二分类器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110220887.5/2.html,转载请声明来源钻瓜专利网。