[发明专利]数据标注系统、方法和数据标注管理器在审

专利信息
申请号: 202210625083.8 申请日: 2020-04-30
公开(公告)号: CN115204256A 公开(公告)日: 2022-10-18
发明(设计)人: 刘新春;王健 申请(专利权)人: 华为技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08;G06F16/22;G06F9/50;G06N5/04
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 郑晓玉
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 标注 系统 方法 管理器
【说明书】:

本申请实施例公开了一种数据标注系统、方法和数据标注管理器,属于机器学习技术领域。该系统包括数据标注管理器、标注模型存储仓库和基础计算单元存储仓库。数据标注管理器接收数据标注请求,在基础计算单元存储仓库中获取目标基础计算单元,并对其分配硬件资源,建立目标计算单元,获取第一标注模型的基础参数数据的第一存储路径信息并发送至目标计算单元。目标计算单元通过第一存储路径信息,在标注模型存储仓库中获取待使用标注模型的基础参数数据,将目标模型推理框架和第一标注模型的基础参数数据组合成第一标注模型,使用第一标注模型,对待标注数据进行标注。采用本申请,可以使可选择的标注模型更加丰富,更好的为用户提供数据标注服务。

本申请是分案申请,原申请的申请号是202080005146.9,原申请日是2020年04月30日,原申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器学习技术领域,特别涉及一种数据标注系统、方法和数据标注管理器。

背景技术

一个能投入应用的机器学习模型,需要经过模型建立和模型训练的过程。在模型训练时,通常需要采集大量样本数据,并对样本数据进行标注,将每个样本数据和对应的标注结果作为一组训练样本,对建立的模型进行训练。可见,样本标注在模型训练中是必不可少一步。

目前,有标注需求的用户可以通过向数据标注系统上传需要标注的数据,然后,数据标注系统可以使用已经集成好的标注模型,对用户上传的数据进行标注。对于数据标注系统中的标注模型,通常由技术人员采用硬编码的方式,将训练后的标注模型集成到数据标注系统中。

在实现本申请的过程中,发明人发现现有技术至少存在以下问题:

当前标注模型只能由技术人员通过硬编码的方式集成到数据标注系统中,而无法使用用户自己的标注模型进行标注。如果用户需要使用自己的标注模型对样本数据进行标注,那么,在目前的数据标注系统中无法实现。可见,当前的数据标注系统的灵活性较差,只能使用技术人员集成的标注模型。

发明内容

为了解决相关技术中数据标注系统灵活性差,只能使用技术人员集成的标注模型的问题,本申请实施例提供了一种数据标注系统、方法和数据标注管理器。所述技术方案如下:

第一方面,提供了一种数据标注系统,所述数据标注系统包括数据标注管理器、标注模型存储仓库和基础计算单元存储仓库,其中:

所述数据标注管理器,用于接收客户端发送的数据标注请求,其中,所述数据标注请求中携带有所述第一标注模型的模型标识和硬件资源分配信息;在所述基础计算单元存储仓库中获取目标基础计算单元,其中,所述目标基础计算单元中包括所述第一标注模型对应的目标模型推理框架和硬件驱动调用工具;基于所述硬件资源分配信息,对所述目标基础计算单元分配硬件资源,建立目标计算单元;在存储的模型标识和基础参数数据的存储路径信息的对应关系中,获取所述第一标注模型的模型标识对应的基础参数数据的第一存储路径信息,向所述目标计算单元发送所述第一存储路径信息;

所述目标计算单元,用于通过所述第一存储路径信息,在所述标注模型存储仓库中获取所述待使用标注模型的基础参数数据,其中,所述第一标注模型的基础参数数据包括所述第一标注模型中的可训练参数训练后的值;将所述目标模型推理框架和所述第一标注模型的基础参数数据组合,得到所述第一标注模型;获取待标注数据;将所述待标注数据输入所述第一标注模型,对所述待标注数据进行标注。

在本申请实施例所示的方案中,数据标注系统可以在单体服务器中实现,例如,数据标注管理器是该单体服务器中的一个功能模块,而标注模型存储仓库和基础计算单元存储仓库是该单体服务器中的存储区。当然,该数据标注系统也可以是一个服务器集群,其中,数据标注管理器、标注模型存储仓库和基础计算单元存储仓库可以分别部署在服务器集群中的不同服务器中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210625083.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top