[发明专利]标注数据的处理方法和装置有效

专利信息
申请号: 202010084966.3 申请日: 2020-02-10
公开(公告)号: CN111259980B 公开(公告)日: 2023-10-03
发明(设计)人: 赵宇 申请(专利权)人: 北京小马慧行科技有限公司
主分类号: G06F18/214 分类号: G06F18/214;G06F18/22
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 肖璐
地址: 100094 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标注 数据 处理 方法 装置
【说明书】:

发明公开了一种标注数据的处理方法和装置。其中,该方法包括:获取目标场景的标注结果和训练结果,其中,目标场景包括多个标注对象,标注结果包括对每个标注对象的标注子结果,训练结果包括机器模型输出的对每个标注对象的识别结果;将标注结果和训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果;基于标注对象的识别子结果对标注对象的标注子结果进行检测,判断标注对象的标注子结果是否准确。本发明解决了现有技术中对标注行为进行审核的效率较低的技术问题。

技术领域

本发明涉及数据标记领域,具体而言,涉及一种标注数据的处理方法和装置。

背景技术

数据标注的种类繁多,例如:分类、拉框、注释、标记等,其用于为机器学习构建训练数据,可以包括训练集和测试集。因此标注的准确度对训练结果的影响非常大。

为了保证数据标注的准确性,需要在数据标注后对标注结果进行审核,目前通常由人工的方式对标注的结果进行审核,导致审核的效率较低。

针对现有技术中对标注行为进行审核的效率较低的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种标注数据的处理方法和装置,以至少解决现有技术中对标注行为进行审核的效率较低的技术问题。

根据本发明实施例的一个方面,提供了一种标注数据的处理方法,包括:获取目标场景的标注结果和训练结果,其中,目标场景包括多个标注对象,标注结果包括对每个标注对象的标注子结果,训练结果包括机器模型输出的对每个标注对象的识别结果;将标注结果和训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果;基于标注对象的识别子结果对标注对象的标注子结果进行检测,判断标注对象的标注子结果是否准确。

进一步地,将标注结果和训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果,包括:获取标注结果和训练结果中每个标注对象在目标场景内的位置;确定在标注结果和训练结果中处于相同位置的标注对象为同一个标注对象。

进一步地,标注子结果包括对标注对象标注得到的类别,识别子结果包括机器模型对标注对象识别得到的类别,基于标注对象的识别子结果对标注对象的标注子结果进行检测,判断标注对象的标注子结果是否准确,包括:检测标注对象的标注子结果与标注对象的识别子结果是否相同;如果标注对象的标注子结果与标注对象的识别子结果不同,则确定标注对象存在错标。

进一步地,基于标注对象的识别子结果对标注对象的标注子结果进行检测,判断标注对象的标注子结果是否准确的步骤还包括:如果标注对象不存在对应的标注子结果,则确定标注对象漏标。

进一步地,标注子结果包括标注得到的标注对象在目标场景中的第一区域,识别子结果包括通过机器模型识别得到的标注对象在目标场景中的第二区域,在基于标注对象的识别子结果对标注对象的标注子结果进行检测,判断标注对象的标注子结果是否准确之前,上述方法还包括:获取第一区域和第二区域;比对同一个标注对象的第一区域和第二区域的大小;如果同一个标注对象的第一区域和第二区域大小不同,则根据第二区域对第一区域进行调整。

进一步地,基于标注对象的识别子结果对标注对象的标注子结果进行检测得到的检测结果包括:标注准确、错标和漏标,在基于标注对象的识别子结果对标注对象的标注子结果进行检测,判断标注对象的标注子结果是否准确之后,上述方法还包括:显示提示信息,其中,提示信息用于指示检测结果为错标或漏标的标注对象;接收调整指令,其中,调整指令用于调整错标或漏标的标注对象的标注子结果;根据调整指令对错标或漏标的标注对象的标注子结果进行调整。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小马慧行科技有限公司,未经北京小马慧行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010084966.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top