[发明专利]一种基于主动学习的在线图像样本标注系统、标注方法及其应用在审

专利信息
申请号: 201910831633.X 申请日: 2019-09-04
公开(公告)号: CN112446404A 公开(公告)日: 2021-03-05
发明(设计)人: 秦迎梅;门聪;韩春晓;卢梅丽;车艳秋 申请(专利权)人: 天津职业技术师范大学(中国职业培训指导教师进修中心)
主分类号: G06K9/62 分类号: G06K9/62;G06N20/00
代理公司: 天津创智天诚知识产权代理事务所(普通合伙) 12214 代理人: 李薇
地址: 300222 天*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 主动 学习 在线 图像 样本 标注 系统 方法 及其 应用
【说明书】:

发明公开了一种基于主动学习的在线图像样本标注系统、标注方法及其应用,所述标注方法包括以下步骤:标注平台前端从标注平台后端抽取未标注图片、以及当前机器学习模型对图片进行处理得到的预测类别和预测分数进行展示;抽取未标注图片时,基于主动学习算法优先抽取重要样本到数据库,然后通过标注平台前端进行展现给标注者;标注者在标注平台前端中挑选预测错误的样本进行标注,得到标注结果,并反馈到数据库;平台后端定时对数据库内的数据进行抽取,自动反馈给机器学习模型进行训练。提高机器学习模型的准确度。本发明通过主动学习方法优先标注最重要的样本,把正确和错误的样本反馈给机器学习模型,使模型能够自适应的不断提升预测准确率。

技术领域

本发明涉及图像处理技术领域,特别是涉及一种基于主动学习的在线图像样本标注系统及其标注方法。

背景技术

近年来,深度学习方法在图像识别的应用中越来越普遍,但是深度学习方法的准确率依赖于大数据,因此催生了很多数据标注产业,但是对于一个在线的模型来说,数据标注的流程很复杂,首先要从在线系统后台获取数据,然后分发给数据标注者,标注好后再反馈,中间可能还需要对标注错误进行修正,最后才能加入新数据对模型进行重新训练。整个流程很长,对样本的重要程度也未做区分,这影响了模型的适应性。

发明内容

本发明的目的是针对现有技术中存在的利用数据标注识别图像流程长且适应性差的问题,而提供一种基于主动学习的在线图像样本标注系统。

本发明的另一个目的是提供在线图像样本标注系统的标注方法,通过重要样本不断优化机器学习模型,提高其预测准确率。

本发明的另一个目的是提供所述在线图像样本标注方法在垃圾分类中的应用,提高自动识别分类的正确率。

为实现本发明的目的所采用的技术方案是:

一种基于主动学习的在线图像样本标注系统,包括标注平台和搭建在标注平台中的机器学习模型,其中所述标注平台包括标注平台后端、标注平台前端和标注平台管理者前端,其中:

所述标注平台后端中包括存储有图片信息和标注者信息的数据库,其中所述图片信息包括图片、图片路径、图片标注、图片标注者、所述机器学习模型预测得到的图片预测类别和预测分数;所述标注者信息包括总标注数量、标注正确率;

所述标注平台前端用于展示图片、机器学习模型预测得到的图片预测类别、机器学习模型预测得到的预测分数(预测值)和供标注者选择的标注下拉菜单;

所述标注平台管理者前端用于展示整体标注情况,比如标注者与标注图片的对应信息,每个标注者标注了哪些图片及其具体标注信息,标注者可对标注质量进行抽查。平台管理者基于每个标注者的标注数量和质量定期对薪酬进行结算。

在上述技术方案中,所述标注平台前端为web标注平台前端,可利用bootstrap前端技术搭建。

在上述技术方案中,所述标注平台后端为web标注平台后端,数据库为PostgreSQL数据库,web标注平台后端利用python django框架搭建,把数据关系通过django中的model类映射到PostgreSQL数据库。

在上述技术方案中,所述web标注平台后端部署于阿里云。

在上述技术方案中,所述机器学习模型为ResNet,DenseNet或NasNet模型。

本发明的另一方面,所述基于主动学习的在线图像样本标注系统在垃圾分类中的应用。

本发明的另一方面,一种基于主动学习的在线图像样本标注方法,包括以下步骤:

步骤1,标注平台前端从标注平台后端抽取未标注图片、以及当前机器学习模型对图片进行处理得到的预测类别(总共10个分类)和预测分数(0-1之间)进行展示;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津职业技术师范大学(中国职业培训指导教师进修中心),未经天津职业技术师范大学(中国职业培训指导教师进修中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910831633.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top