[发明专利]数据标注方法及装置在审

专利信息
申请号: 202010072476.1 申请日: 2020-01-21
公开(公告)号: CN111291802A 公开(公告)日: 2020-06-16
发明(设计)人: 金晶 申请(专利权)人: 华为技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 颜晶
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 标注 方法 装置
【说明书】:

本申请公开了一种数据标注方法及装置,属于计算机技术领域。所述方法包括:采用多个已标注数据中的第一数据,对第一数据标注模型进行权重冻结比例不同的多组迁移学习训练;基于多组迁移学习训练的权重冻结比例,以及多组迁移学习训练后的第一数据标注模型,确定目标权重冻结比例;采用多个已标注数据中的第二数据,对第一数据标注模型进行目标权重冻结比例的迁移学习训练,得到第二数据标注模型;采用第二数据标注模型对待标注数据进行标注;其中,待标注数据的待标注信息与已标注数据的已标注信息相同。本申请解决了无法实现某些待标注数据的标注的问题,实现了对待标注数据进行标注的问题,本申请用于数据标注。

技术领域

本申请涉及计算机技术领域,特别涉及一种数据标注方法及装置。

背景技术

随着计算机技术的发展,机器模型得到了广泛的应用,机器模型能够辅助人们对数据进行处理。比如,数据标注模型能够对数据进行标注,对数据进行标注也即对数据标注一些信息。

在采用数据标注模型标注数据前,需要筛选合适的数据标注模型。比如,要求筛选的数据标注模型用于标注的信息与待标注数据的待标注信息相同,且要求筛选的数据标注模型的数据标注方式与待标注数据要求的数据标注方式相同。示例地,上述数据标注方式可以为:基于分类的标注方式(会标注数据的类别),或者基于目标检测的标注方式(会在数据中标注目标所在的位置)等。

但是,待标注数据的待标注信息往往多种多样,而已有的数据标注模型用于标注的信息往往有限,这就导致可能无法在已有数据标注模型中筛选到合适的数据标注模型,从而无法实现某些待标注数据的标注。

发明内容

本申请提供了一种数据标注方法及装置,可以解决无法实现某些待标注数据的标注的问题,所述技术方案如下:

第一方面,提供了一种数据标注方法,所述方法包括:首先采用多个已标注数据中的第一数据,对第一数据标注模型进行权重冻结比例不同的多组迁移学习训练;之后再基于所述多组迁移学习训练的权重冻结比例,以及所述多组迁移学习训练后的所述第一数据标注模型,确定目标权重冻结比例;在确定目标权重冻结比例之后,便可以采用所述多个已标注数据中的第二数据,对所述第一数据标注模型进行所述目标权重冻结比例的迁移学习训练,得到第二数据标注模型;其中,所述待标注数据的待标注信息与所述已标注数据的已标注信息相同,因此,该第二数据标准模型可以用于对待标注数据进行标注。最后,可以采用所述第二数据标注模型对待标注数据进行标注。

本申请实施例提供的数据标注方法中,能够对第一数据标注模型进行训练,以得到适用于对待标注数据进行标注的第二数据标注模型,从而避免了在已有的数据标注模型中无法找到合适的模型时,无法对待标注数据进行标注的问题。并且,本申请实施例中在对第一数据标注模型进行训练时,采用了迁移学习训练的方式,因此能够缩短训练时长,提升训练的效率。

可选地,上述确定目标权重冻结比例的过程可以包括:基于所述多组迁移学习训练的权重冻结比例,以及所述多组迁移学习训练后的所述第一数据标注模型,采用贝叶斯优化的方法确定所述目标权重冻结比例。本申请实施例中在对第一数据标注模型进行训练的过程中,还结合了贝叶斯优化的方法较为准确地确定了目标权重冻结比例,提升了得到的目标权重冻结比例的准确度和速度,且提升了基于该目标权重冻结比例训练得到的第二数据标注模型的准确度。

可选地,所述第一数据包括:所述多个已标注数据中的一部分数据,所述第二数据包括:所述多个已标注数据中的另一部分数据。可见,对第一数据标注模型进行多组训练仅需采用多个已标注数据中的一部分数据即可,而无需采用多个已标注数据中的全部数据;这样能够减少迁移学习训练所需的时长,提升迁移学习训练的效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010072476.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top