[发明专利]训练样本的标注方法、装置和系统有效

专利信息
申请号: 201810211224.5 申请日: 2018-03-14
公开(公告)号: CN108537129B 公开(公告)日: 2021-01-08
发明(设计)人: 合敏慈 申请(专利权)人: 北京影谱科技股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06N20/00
代理公司: 北京万思博知识产权代理有限公司 11694 代理人: 范晓斌
地址: 100000 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 训练 样本 标注 方法 装置 系统
【说明书】:

本申请公开了一种训练样本的标注方法、装置和系统。其中方法包括:图像获取步骤、图像识别步骤、游戏运行步骤、结果接收步骤和结果判断步骤。利用该方法能够把标注的内容和影视剧剧情等视频内容融合到一起,利用用户的碎片时间,让用户在看视频的同时,随手就能标注图像,让用户在轻松的环境下为通过众包的方式来帮助机器学习标记训练样本,大大降低了机器学习的训练成本,节省了开发机器学习产品的公司在招聘、培训标注人员的方面的时间和成本。

技术领域

本申请涉及图像处理领域,特别是涉及一种训练样本的标注方法、装置和系统。

背景技术

机器学习可以分为有指导学习和无指导学习两大类。无指导机器学习指事先没有任何训练数据样本,需要直接对数据进行建模,识别的效率和准确度都不高。有指导机器学习指通过已有的训练样本来训练,从而得到一个最优的模型,再利用这个模型将所有的新数据样本映射为相应的输出结果,那么这个最优模型也就具有了对未知数据进行分类的能力。在图像识别领域的机器学习通常会采用有指导机器学习的方法来训练出一个模型。

由于机器学习系统获得的信息往往是不完全的,所以学习系统所进行的推理并不完全是可靠的,它总结出来的规则可能正确,也可能不正确。这要通过训练样本来加以检验。这就需要相对高质量的被正确标记的训练样本,使得模型能够充分学习期望的函数。训练样本标记是否正确、是否足够将直接影响训练模型的准确性。现阶段训练样本标记主要由人工来完成。当前机器学习中的难点在于训练样本过于庞大,面对浩瀚的资源,完全由人工来标注将花费大量的时间和人力,标注人员长期做这项枯燥而乏味的工作容易厌倦,工作效率会逐渐下降,工作质量会逐渐降低且人力成本较高。

发明内容

本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。

根据本申请的一个方面,提供了一种训练样本的标注方法,包括:

图像获取步骤:在用户播放视频时,获取所述视频中的至少一个第一图像;

图像识别步骤:利用待训练的机器学习模型对所述第一图像进行识别,将识别的结果保存为第一识别结果;

游戏运行步骤:响应于所述用户暂停播放所述视频的操作,显示基于所述视频生成的游戏的界面,所述界面中至少显示所述第一图像、所述第一识别结果、预存的第二图像和预存的与第二图像对应的第二识别结果,其中,所述第二识别结果是对所述第二图像进行标注得到的正确的识别结果;

结果接收步骤:接收所述用户对所述界面显示的所述第一识别结果和所述第二识别结果的判断;和

结果判断步骤:根据所述用户对所述第二识别结果的判断,确定所述用户对所述第一识别结果的判断结果的置信水平。

利用该方法能够把标注的内容和影视剧剧情等视频内容融合到一起,利用用户的碎片时间,让用户在看视频的同时,随手就能标注图像,让用户在轻松的环境下为通过众包的方式来帮助机器学习标记训练样本,大大降低了机器学习的训练成本,节省了开发机器学习产品的公司在招聘、培训标注人员的方面的时间和成本。

可选地,所述图像获取步骤包括:

图像捕获步骤:在所述用户利用终端播放所述视频时,实时捕获当前播放的视频帧,将所述视频帧存储在所述终端中;

图像压缩步骤:在存储的所述视频帧到达预定数量时,将所述预定数量的所述视频帧进行压缩并传送到服务器;

图像解压步骤:在所述服务器接收到压缩的所述视频帧后,将所述视频帧解压缩并保存到训练样本临时数据库中;和

图片比对步骤:对于所述视频帧中的每一个,使用尺度不变特征变换匹配算法分析该视频帧是否已经存在于训练样本数据库中,如果否,就将该视频帧作为第一图像并对所述第一图像打上标签,将所述第一图像和所述标签保存在训练样本未标识数据库中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京影谱科技股份有限公司,未经北京影谱科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810211224.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top