[发明专利]一种基于网络监督的目标分类和定位方法有效

专利信息
申请号: 201910941413.2 申请日: 2019-09-30
公开(公告)号: CN110717534B 公开(公告)日: 2020-09-15
发明(设计)人: 叶齐祥;付梦莹;万方;韩振军;焦建彬 申请(专利权)人: 中国科学院大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 北京康思博达知识产权代理事务所(普通合伙) 11426 代理人: 孙建玲;刘冬梅
地址: 100049 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网络 监督 目标 分类 定位 方法
【说明书】:

发明提供了一种基于网络监督的目标分类和定位方法,包括以下步骤:根据待测目标的类别自动从搜索引擎获取大量网络图像数据;过滤去除噪声图像,形成训练样本集;初步构建分类和定位网络;将训练样本集中的样本输入到初步构建的分类和定位网络中进行特征提取,将特征分类,并得到目标物体的位置信息,实施对分类和定位网络的训练。本发明中该端到端的基于网络监督的精细分类与定位方法,利用海量易获取的网络图像作为训练集,完全去除人工标注,仅使用图像级别标签,设计一个高效的卷积网络,融入全局平均池化和类激活映射图等算法,使得本发明在精细分类任务及定位任务上性能超越弱监督学习方法。

技术领域

本发明涉及计算机视觉和图像处理领域,尤其涉及一种可用于智能化自动识别等方向的基于网络监督的目标分类及定位方法,该方法可以广泛应用于手机拍照自动识别领域。

背景技术

全监督和弱监督学习下的目标定位及检测任务在近几年内发展迅速,最先进的性能在被不断刷新,如何进一步提高性能呢?显然,设计更深层的网络或使用更多的训练数据是研究者们探索的两个方向。事实上,设计更深层的网络势必要扩充数据,因此,如何向网络提供更多的数据是有待研究的关键问题。

凭借大量的在线视觉数据,网络和社交媒体成为了视觉研究的最重要的数据来源。目前有一些解决视觉任务的数据集如:ImageNet、PASCAL VOC、MS COCO等等,它们从Google或Flickr网络下载大量的图像,利用昂贵的人力,人为剔除网络图像中的噪声图像,并对图像中目标物体的位置进行标注。这些人工标注确实在相关视觉任务中表现良好。

但是,人工标注有两个很大的弊端,其一是人工标注成本非常昂贵且耗时,对于一些需要大型数据集的任务,由于资金限制,良好且适合的人工标注数据集往往很难获得;其二是人工标注的数据集带有很多的主观因素,不同人对于一些比较模糊的概念的理解可能带有不同的偏见,标注结果很可能会因人而异,导致整个数据集的划分标准不统一或不完整。

因此,一种更高效、廉价的数据集获取渠道——网络监督在近几年发展迅速,吸引了一批工作者。网络监督学习利用从网络上爬取的免费图像进行视觉特征学习,完成目标分类或检测任务。

目前网络监督研究工作倾向于解决噪声图像标签和域名转移问题。例如NEIL使用半监督学习算法,依靠多实例学习(MIL)来减少网络图像中的噪声图像,企图建立一个永无止境的学习器,自动从网络数据中提取视觉知识,尝试使用最少的人为干预构建世界上最大的视觉结构知识库。LEAA介绍了一种全自动的方法,用于学习任何概念中各种变化的广泛模型(例如操作、交互、属性等)。该方法利用了大量的在线图书资源来发现词汇的差异,并将数据收集和建模步骤交织在一起,以减少在培训模型时需要明确的人工监督。Chen等人提出了一种两阶段网络监督方法,首先通过谷歌浏览器下载简单图像训练CNN网络,得到初始化视觉特征,该网络用来找到简单图像中的相似性关系,利用关系图在更真实的Flickr图像上训练,微调初始网络。

上述网络监督学习方法或多或少都加入了人为干预或辅助标记,并且性能上仍然无法与弱监督学习匹敌。因此,网络监督学习方法仍存在诸多问题,有很大的进步空间。

发明内容

为了克服上述问题,本发明人进行了锐意研究,针对网络监督中存在的问题,提出了一种全新的基于网络监督的精细分类与定位任务的方法,完全去除人为干预,利用海量易获取的网络图像,通过重复使用图像数据让嘈杂的网络图像数据集内部相互验证达到过滤的效果,最终得到干净的网络图像训练集,减轻了噪声图像数据对分类定位性能的影响;仅使用图像级别标签,减轻了人为标注的压力;设计了一个高效的卷积网络,融入全局平均池化和类激活映射图等算法,使其同时在精细分类任务及定位任务性能上超越弱监督学习,从而完成本发明。

本发明的目的在于提供以下技术方案:

本发明的目的在于提供一种基于网络监督的目标分类和定位方法,该方法包括训练分类和定位网络用以进行目标分类和定位的过程,分类和定位网络的训练过程包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大学,未经中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910941413.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top