[发明专利]用于生成尤其用于训练神经网络的加标签的数据的方法在审
申请号: | 202011524064.3 | 申请日: | 2020-12-22 |
公开(公告)号: | CN113095350A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | C·哈斯-舒茨;H·赫特林;R·斯陶 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 卢江;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 尤其 训练 神经网络 标签 数据 方法 | ||
用于生成尤其用于训练神经网络的加标签的数据的方法。本公开涉及用于生成尤其用于神经网络的加标签的数据、例如训练数据的方法(100,1000)和设备(200)。
技术领域
本公开涉及一种用于生成尤其用于未加标签的数据的标签的方法。所得到的加标签的数据例如可以被用作训练数据,尤其用于神经网络。
此外,本公开涉及一种用于执行第一方法和/或其他方法的设备。
背景技术
机器学习、尤其利用神经网络、尤其深度神经网络(英语:Deep Neural Network,DNN)进行学习的方法在许多问题的情况下胜过经典的未经训练的用于模式识别的方法。几乎所有这些方法都基于监督式学习。
监督式学习需要带注释的或加标签的数据作为训练数据。在下文中也称为标签的这些注释用作优化算法的目标输出。在此给每个数据元素分配至少一个标签。
标签的质量可能对机器学习方法的经训练的模型的识别性能有影响。从现有技术中已知手动地给用于训练机器学习方法的样本加标签。
发明内容
本公开提供相对于现有技术改进的用于生成标签的方法。
一种实施方式涉及一种用于生成用于数据集的标签的方法,该方法包括:
提供未加标签的数据集,所述未加标签的数据集包括未加标签的数据的第一子集和未加标签的数据的至少一个与第一子集不相交的其他子集;
通过生成用于第一子集的标签来生成加标签的第一子集并且提供加标签的第一子集作为第n个加标签的第一子集,其中n=1;
执行迭代过程,其中迭代过程的第n次迭代针对每个n=1、2、3、...N包括如下步骤:
利用第n个加标签的第一子集训练第一模型作为第n个经训练的第一模型;
通过在使用第n个经训练的第一模型的情况下预测用于其他子集的标签来生成第n个加标签的其他子集;
利用第n个加标签的其他子集训练另一模型作为第n个经训练的其他模型;
通过在使用第n个经训练的其他模型的情况下预测用于第一子集的标签来生成第(n+1)个加标签的第一子集。
该方法基于,从加标签的第一子集出发,在迭代方法中训练第一模型和其他模型,并且由此逐步改进利用模型预测的标签、尤其标签的质量。在此,利用用于泛化的经训练的模型的能力和/或经训练的模型的随迭代增加的精度。
未加标签的数据集或第一和其他子集的未加标签的数据例如是实际数据、尤其传感器的测量值、尤其多模数据。所述传感器例如根据不完全的示例性的列举可以是雷达传感器、光学摄像机、超声传感器、激光雷达传感器或红外传感器。这种传感器通常使用在机动车中的自主和半自主功能中或一般使用在机器人中。
针对第一子集的首先还未加标签的数据,生成标签。所公开的方法的优点是,在该步骤中有错误地生成标签就足够了。标签的生成因此可以比较简单地并且因此相对快速地和成本低地实现。
生成用于第一子集的标签例如在使用自动方法的情况下进行。可以被证明为有利的是,使用未经训练的方法、尤其经典的模式识别算法,对于所述模式识别算法而言不需要训练数据。尤其也可能的是,使用在其他数据集上训练的方法,而不与当前数据集适配。也可以设想如下实施方式,在所述实施方式中手动地生成用于第一子集的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011524064.3/2.html,转载请声明来源钻瓜专利网。