[发明专利]数据标注方法及装置在审
申请号: | 202010072476.1 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111291802A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 金晶 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 颜晶 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 标注 方法 装置 | ||
本申请公开了一种数据标注方法及装置,属于计算机技术领域。所述方法包括:采用多个已标注数据中的第一数据,对第一数据标注模型进行权重冻结比例不同的多组迁移学习训练;基于多组迁移学习训练的权重冻结比例,以及多组迁移学习训练后的第一数据标注模型,确定目标权重冻结比例;采用多个已标注数据中的第二数据,对第一数据标注模型进行目标权重冻结比例的迁移学习训练,得到第二数据标注模型;采用第二数据标注模型对待标注数据进行标注;其中,待标注数据的待标注信息与已标注数据的已标注信息相同。本申请解决了无法实现某些待标注数据的标注的问题,实现了对待标注数据进行标注的问题,本申请用于数据标注。
技术领域
本申请涉及计算机技术领域,特别涉及一种数据标注方法及装置。
背景技术
随着计算机技术的发展,机器模型得到了广泛的应用,机器模型能够辅助人们对数据进行处理。比如,数据标注模型能够对数据进行标注,对数据进行标注也即对数据标注一些信息。
在采用数据标注模型标注数据前,需要筛选合适的数据标注模型。比如,要求筛选的数据标注模型用于标注的信息与待标注数据的待标注信息相同,且要求筛选的数据标注模型的数据标注方式与待标注数据要求的数据标注方式相同。示例地,上述数据标注方式可以为:基于分类的标注方式(会标注数据的类别),或者基于目标检测的标注方式(会在数据中标注目标所在的位置)等。
但是,待标注数据的待标注信息往往多种多样,而已有的数据标注模型用于标注的信息往往有限,这就导致可能无法在已有数据标注模型中筛选到合适的数据标注模型,从而无法实现某些待标注数据的标注。
发明内容
本申请提供了一种数据标注方法及装置,可以解决无法实现某些待标注数据的标注的问题,所述技术方案如下:
第一方面,提供了一种数据标注方法,所述方法包括:首先采用多个已标注数据中的第一数据,对第一数据标注模型进行权重冻结比例不同的多组迁移学习训练;之后再基于所述多组迁移学习训练的权重冻结比例,以及所述多组迁移学习训练后的所述第一数据标注模型,确定目标权重冻结比例;在确定目标权重冻结比例之后,便可以采用所述多个已标注数据中的第二数据,对所述第一数据标注模型进行所述目标权重冻结比例的迁移学习训练,得到第二数据标注模型;其中,所述待标注数据的待标注信息与所述已标注数据的已标注信息相同,因此,该第二数据标准模型可以用于对待标注数据进行标注。最后,可以采用所述第二数据标注模型对待标注数据进行标注。
本申请实施例提供的数据标注方法中,能够对第一数据标注模型进行训练,以得到适用于对待标注数据进行标注的第二数据标注模型,从而避免了在已有的数据标注模型中无法找到合适的模型时,无法对待标注数据进行标注的问题。并且,本申请实施例中在对第一数据标注模型进行训练时,采用了迁移学习训练的方式,因此能够缩短训练时长,提升训练的效率。
可选地,上述确定目标权重冻结比例的过程可以包括:基于所述多组迁移学习训练的权重冻结比例,以及所述多组迁移学习训练后的所述第一数据标注模型,采用贝叶斯优化的方法确定所述目标权重冻结比例。本申请实施例中在对第一数据标注模型进行训练的过程中,还结合了贝叶斯优化的方法较为准确地确定了目标权重冻结比例,提升了得到的目标权重冻结比例的准确度和速度,且提升了基于该目标权重冻结比例训练得到的第二数据标注模型的准确度。
可选地,所述第一数据包括:所述多个已标注数据中的一部分数据,所述第二数据包括:所述多个已标注数据中的另一部分数据。可见,对第一数据标注模型进行多组训练仅需采用多个已标注数据中的一部分数据即可,而无需采用多个已标注数据中的全部数据;这样能够减少迁移学习训练所需的时长,提升迁移学习训练的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010072476.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:任务分配方法、装置以及计算设备、存储介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置