[发明专利]机器学习模型能力的获取方法、系统、终端、介质及应用在审

专利信息
申请号: 202110824038.0 申请日: 2021-07-21
公开(公告)号: CN113344916A 公开(公告)日: 2021-09-03
发明(设计)人: 王天鹤;章曙涵;熊意超 申请(专利权)人: 上海媒智科技有限公司
主分类号: G06T7/00 分类号: G06T7/00;G06T5/00;G06N20/00
代理公司: 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 代理人: 刘翠
地址: 200030 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 机器 学习 模型 能力 获取 方法 系统 终端 介质 应用
【说明书】:

本发明提供了一种机器学习模型能力的快速获取方法及系统,包括:获取机器学习处理任务所需的原始数据,并进行预处理,得到初始数据;获取通用任务模型,并采用所述通用任务模型对所述初始数据进行信息标注,得到初步标注信息;对得到的所述初步标注信息进行数据验证,构建数据集;建立机器学习模型,并采用所述数据集对所述机器学习模型进行训练,完成对机器学习模型能力的快速获取。同时提供了一种相应的终端、介质及应用。本发明在数据标注明显不足时,能够快速获取标注数据对相应任务的模型能力进行训练。

技术领域

本发明涉及机器学习技术领域,具体地,涉及一种机器学习模型能力的快速获取方法、系统、终端、介质及应用。

背景技术

对于机器学习、深度学习任务来说,标注数据的获取是至关重要的一环。大多数情况下,这类数据需要通过人工标注来实现。在计算机视觉这个分支领域,训练深度神经网络模型所需的数据量通常非常庞大,对这样庞大的数据集进行人工标注通常存在如下问题:

1.工作量大,重复率高;

2.操作繁琐,流程复杂;

3.对于特定任务,有时需要标注人员有一定的先验知识,这依赖特定业务人员对标注人员的培训,而标注人员学习质量极大影响标注质量。

这些问题使得人工标注的成本居高不下,同时在实际生产过程中标注的速度和质量也极大影响着整个项目的进程与效果。针对上述问题,亟需一种在降低人工成本前提下的快速获取标注的方法。目前,有通过先使用少量标注训练模型再不断使用模型进行标注,从而不断迭代的方法;也有通过对连续图像中同一物体的追踪来提高标注效率的方法。

经过检索发现:

公开号为CN112434794A的中国发明专利申请《一种基于深度学习的计算机视觉数据集半自动标注方法及系统》,提出了一种不断迭代的方法。该方法通过先抽取一部分数据进行标注和增广并训练模型,再通过模型来得到标注,经过人工复检来得到最终标注。方法由于需要首先对数据集的子集进行人工标注,如果子集的选择不够多或者不能代表整体数据集的分布,那么后续人工复检的成本其实与直接标注接近,仍没有解决上述问题。

授权公告好为CN103218603B的中国发明专利《一种人脸自动标注方法及系统》,提出了一种基于追踪和唇动检测等信息结合的辅助标注方法。该方法通过人脸检测,镜头分割,人脸追踪,唇动检测等一系列模块的逻辑组合来达到辅助标注的效果。这种方法只能在特定的人脸场景下使用,其复杂的模块间的调用逻辑使该方法难以迁移到其他任务中来。

公开号为CN112036441A的中国发明专利申请《机器学习物体检测结果的反馈标注方法和装置、存储介质》,提出了一种机器学习物体检测结果的反馈标注方法和装置、存储介质,通过记录机器学习执行物体检测获得的标注框和人工标注的标注框,并进行比对来实现检验机器学习物体检测结果的正确性的反馈机制。该方法仍然需要首先对数据集进行人工标注,且只能在特定的物体检测任务中使用。

综上所述,现有的标注技术仍然没有解决上述问题。

发明内容

本发明针对现有技术中存在的上述不足,提供了一种机器学习模型能力的快速获取方法、系统、终端、介质及应用。

根据本发明的一个方面,提供了一种机器学习模型能力的获取方法,包括:

获取机器学习处理任务所需的原始数据,并进行预处理,得到初始数据;

获取通用任务模型,并采用所述通用任务模型对所述初始数据进行任务目标信息标注,得到初步标注信息;

对得到的所述初步标注信息进行数据验证,构建数据集;

建立机器学习模型,并采用所述数据集对所述机器学习模型进行训练,完成对机器学习模型能力的快速获取。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海媒智科技有限公司,未经上海媒智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110824038.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top