[发明专利]一种基于主动学习的在线图像样本标注系统、标注方法及其应用在审
申请号: | 201910831633.X | 申请日: | 2019-09-04 |
公开(公告)号: | CN112446404A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 秦迎梅;门聪;韩春晓;卢梅丽;车艳秋 | 申请(专利权)人: | 天津职业技术师范大学(中国职业培训指导教师进修中心) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 天津创智天诚知识产权代理事务所(普通合伙) 12214 | 代理人: | 李薇 |
地址: | 300222 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 学习 在线 图像 样本 标注 系统 方法 及其 应用 | ||
1.一种基于主动学习的在线图像样本标注系统,其特征在于,包括标注平台和搭建在标注平台中的机器学习模型,其中所述标注平台包括标注平台后端、标注平台前端和标注平台管理者前端,其中:
所述标注平台后端中包括存储有图片信息和标注者信息的数据库,其中所述图片信息包括图片、图片路径、图片标注、图片标注者、所述机器学习模型预测得到的图片预测类别和预测分数;所述标注者信息包括总标注数量、标注正确率;
所述标注平台前端用于展示图片、机器学习模型预测得到的图片预测类别、机器学习模型预测得到的预测分数和供标注者选择的标注下拉菜单;
所述标注平台管理者前端用于展示整体标注情况。
2.如权利要求1所述的基于主动学习的在线图像样本标注系统,其特征在于,所述标注平台前端为web标注平台前端,可利用bootstrap前端技术搭建。
3.如权利要求1所述的基于主动学习的在线图像样本标注系统,其特征在于,所述标注平台后端为web标注平台后端,数据库为PostgreSQL数据库,web标注平台后端利用pythondjango框架搭建,把数据关系通过django中的model类映射到PostgreSQL数据库。
4.如权利要求1所述的基于主动学习的在线图像样本标注系统,其特征在于,所述机器学习模型为ResNet,DenseNet或NasNet模型。
5.如权利要求1所述的基于主动学习的在线图像样本标注系统在垃圾分类中的应用。
6.一种基于主动学习的在线图像样本标注方法,其特征在于,包括以下步骤:
步骤1,标注平台前端从标注平台后端抽取未标注图片、以及当前机器学习模型对图片进行处理得到的预测类别和预测分数进行展示;
抽取未标注图片时,基于主动学习算法优先抽取重要样本到数据库,然后通过标注平台前端进行展现给标注者;
步骤2,标注者在标注平台前端中挑选预测错误的样本进行标注,得到标注结果,并反馈到数据库;
步骤3,平台后端定时对数据库内的具有标注结果的图片进行抽取,自动反馈给机器学习模型进行训练。
7.如权利要求6所述的基于主动学习的在线图像样本标注方法,其特征在于,所述步骤2中所述主动学习算法通过信息熵计算查询重要样本,信息熵计算公式为:H(x)=-∑P(xi)log(P(xi))(i=1,2,..n),其中:H(x)为信息熵,P(xi)为给定机器学习模型对各图片预测类别的预测概率(相加为1),n=10,选取信息熵H(x)大于1的样本为重要样本,进行优先标注。
8.如权利要求7所述的基于主动学习的在线图像样本标注方法,其特征在于,所述给定机器学习模型为基于InceptionV3通过大量图片样本学习得到的模型。
9.如权利要求6所述的基于主动学习的在线图像样本标注方法,其特征在于,所述步骤2中重要样本展现给专家进行标记,然后利用专家标记信息训练当前机器学习模型。
10.如权利要求6所述的基于主动学习的在线图像样本标注方法在垃圾分类中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津职业技术师范大学(中国职业培训指导教师进修中心),未经天津职业技术师范大学(中国职业培训指导教师进修中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910831633.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种目标用户的筛选方法和设备
- 下一篇:用于生成深度图像的系统、方法和装置