[发明专利]使用有噪声的标记和域适配来进行鲁棒的主动学习方法的系统和方法在审
申请号: | 202011509171.9 | 申请日: | 2020-12-18 |
公开(公告)号: | CN113011454A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | R·达斯;F·J·卡布里塔孔德萨;J·Z·科尔特 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/40 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 浩路;周学斌 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 噪声 标记 域适配来 进行 主动 学习方法 系统 方法 | ||
公开了一种用于使用来自另一个域或应用的有噪声的被标记的数据集、在标记预算约束和有噪声的预言(即,由注释器提供的有噪声的标记)的情况下标记未标记的数据集的系统和方法。该系统和方法将主动学习与有噪声的标记进行组合,并且将主动学习与域适配进行组合以增强分类性能。
技术领域
以下内容总体上涉及用于使用有噪声的标记(noisy label)和域适配(domainadaptation)来进行鲁棒的主动学习的系统和方法。
背景技术
通常,对数据集进行标记可能涉及人工注释器,该人工注释器根据预定义的一组所允许的标记将一个或多个标记手动分配给样本。然而,以这种方式对数据集进行手动标记可能需要大量资源和时间。而且,这种手动标记可能会降低自动化机器学习系统的性能。
发明内容
公开了一种用于主动学习算法的系统和方法,该主动学习算法接收被噪声方式标记(noisily labeled)的源数据集。该系统和方法可以应用鲁棒深度学习算法来标识用于被噪声方式标记的源数据集的源分类器。可以使用对抗性域辨别(discrimination)机器学习算法来标识经适配的分类器。该系统和方法可以使用在源分类器上操作的对抗性机器学习算法(即,对抗性网络)来确定经适配的分类器。可以基于可操作地使用目标分类器和经适配的分类器的主动学习算法,将标记分配给未标记的目标数据集内的一个或多个样本。
该系统和方法还可以使用经适配的分类器来热启动主动学习算法。主动学习算法可以可操作以提供用于目标分类器的训练数据。调度器还可以控制用于热启动主动学习算法的持续时间。
设想到的是,鲁棒深度学习算法可以包括softmax层,接着是密集线性层,该密集线性层可操作以对被噪声方式标记的源数据集实行去噪。还可以使用基于最大熵的启发式算法或批主动学习算法来设计主动学习算法。当应用批主动学习算法时,可以每批地更新目标分类器。
附图说明
图1描绘了示例性计算系统。
图2图示了示例性卷积神经网络。
图3图示了主动学习算法的流程图。
图4图示了控制至少部分自主的机器人的计算系统。
图5是一实施例,其中计算机系统可以被用来控制自动化个人助理。
图6是一实施例,其中计算系统可以被用来控制访问控制系统。
图7是一实施例,其中计算系统可以被用来控制监控系统。
图8是一实施例,其中计算系统可以被用来控制成像系统。
具体实施方式
根据需要,在本文中公开了详细的实施例;然而,要理解的是,所公开的实施例仅仅是示例性的,并且可以以各种形式和替代形式来体现。各图不一定按比例绘制;一些特征可能被放大或最小化以示出特定组件的细节。因此,本文中公开的具体结构和功能细节不应被解释为是限制性的,而仅仅是作为教导本领域技术人员以各种方式采用本实施例的代表性基础。
在计算系统中,被标记的数据通常是已经利用一个或多个标记而被加标签的样本(例如,数字图像)。标记通常会采取一组未标记的数据,并且利用提供有用信息的有意义的标签来扩充该未标记的数据中的每一条。例如,标记可能被用来:(1)指示图像是否包括给定对象(例如,狗或猫);(2)识别语音记录内的口头语;或者(3)识别x射线图像内的指示肿瘤的形状。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011509171.9/2.html,转载请声明来源钻瓜专利网。