[发明专利]一种应对增量式新类图像数据的鲁棒弱监督分类方法在审

专利信息
申请号: 202110447613.X 申请日: 2021-04-25
公开(公告)号: CN113095429A 公开(公告)日: 2021-07-09
发明(设计)人: 李宇峰;周志华;朱永南 申请(专利权)人: 南京大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京乐羽知行专利代理事务所(普通合伙) 32326 代理人: 李玉平
地址: 210023 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 应对 增量 式新类 图像 数据 鲁棒弱 监督 分类 方法
【说明书】:

发明公开一种应对增量式新类图像数据的鲁棒弱监督分类方法。具体而言,在开放场景下,数据增量涌现,其中包括未标记、已标记、新类图像。对于已标注图像,加入模型并更新标注数据集合。对于新来的未标注图像,通过特征描述和弱监督学习等技术判断其类别归属。若其属于已知类别,则基于标记传播算法等弱监督学习技术预测其标注类别后加入已有标记数据集合;若检测出其属于未见过的新类别,则将图像放入缓存器,收集足够数量时,及时更新模型并清空缓存器。本发明能够有效实现增量式新类图像数据的鲁棒分类。

技术领域

本发明涉及一种应对增量式新类图像数据的鲁棒弱监督分类方法,属于大数据环境下的人工智能和模式识别任务技术领域。

背景技术

数字图像是互联网时代的重要信息载体,在诸多日常生活和实际应用中扮演着重要的作用。随着个人用户的数字图像的快速增长,如何有效管理和利用数字图像成为一个重要而又具有挑战的工作,而图像标注是其中最为关键任务之一。以往大多数图像标注方法都在静态场景下进行,也就是假定数据的标注齐全,而且类别的集合不会发生变化。然而,随着图像标注任务不断走向开放场景,数据的形式会发生较大变化,已有技术已难以直接适用。具体表现在两个方面。一是,图像人工标注的速度远不及图像产生的速度,因此新涌现的数字图像中存在大量未标记数据。二是,随着时间的推移,数字图像数据经常出现新的类别,不加以区别会导致性能不佳乃至错失重要信息,亟需及时检测并给予合理利用。之前技术围绕上述单个方面提出解决方案,但极少技术能够同时应对上述两个难点的同时解决,提升图像标注在开放场景下的分类效能。

发明内容

发明目的:针对现有技术中开放场景下,图像数据面临的两种常见现象。一是由于数据标注的速度赶不上数据产生的速度,因此数据含有大量无标注样本,不加以利用将造成大量图像数据资源浪费;二是随着时间的推移,图像数据经常出现未见的新类别,如不能及时检测并给予合理利用,将导致分类模型不佳乃至彻底失效。本发明提供一种应对增量式新类图像数据的鲁棒弱监督分类方法,能够发现新类图像,并兼顾大量未标注图像的有效利用,弥补以往图像标注机制需要大量图像标注或者难以检测新类的不足,提升图像标注在开放场景下的效果。本发明以数字图像标注为研究对象,阐述发明要点,其中增量式数据对应于不断涌现的数字图像,数据的分类对应于图像的标注任务。

技术方案:一种应对增量式新类图像数据的鲁棒弱监督分类方法,对增量式图像数据的分类任务采用分而治之的策略。对于标注数据,直接加入并更新标注单元。对于无标注数据,基于随机森林的新类发现单元对无标注数据进行评估,用以判断新来图像是否属于未知新类;如其属于已知类别,则利用历史已知类别的数据和标记传播算法快速预测出其标注类别;如检测出其属于未知新类,则先将该图像数据放入缓存器中,当收集设定数量的新类图像时,及时更新新类发现单元和已知类别标注单元,并清空数据缓存器以持续发现更多新类图像。

一方面,不同类别标注的图像数据在特征上差异较显著,从特征空间上的差异入手,区分新涌现的图像数据和历史已知标注图像数据,检测新类图像。由于历史标注数据的规模庞大,每张新涌现的图像都与所有历史数据逐一比对效率不可行,采用采样和集成学习技术解决上述的计算开销。首先从历史已知标注的图像中选取多个小规模的数据,然后在每个小规模数据上各自单独对新来图像进行标记评估,最后标注单元综合集成所有的标记评估结果以最终判断待标注图像是否是新类。采样能够使得数据规模大幅减少,效率提升;集成学习能够有效规避采样偏差,提高鲁棒性。整体上,上述做法高效且具有不错的鲁棒性。

另一方面,在开放环境下源源不断收集得到的数字图像中往往包含大量的无标注数据。标注单元如果仅利用少量有限的标注图像,忽略大量无标注数据,将错失大量有助于性能提升的重要信息。通过弱监督学习的标记传播技术,图像标注单元自动地综合利用有限的标注数据和大量的无标注数据,从而得到更高质量的标注结果。同时为了能够更高效在开放场景中实现快速响应,标注单元通过选取代表性的历史数据来构建模型,减少更新标注单元的时间开销,大幅提高标注效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110447613.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top