[发明专利]一种基于深度学习的含噪数据下的多标签图像识别方法有效

专利信息
申请号: 202310299402.5 申请日: 2023-03-24
公开(公告)号: CN116012569B 公开(公告)日: 2023-08-15
发明(设计)人: 陈添水;徐志华;黄衍聪;柯梓铭;付晨博;范耀洲;杨志景 申请(专利权)人: 广东工业大学
主分类号: G06V10/20 分类号: G06V10/20;G06N3/08;G06V10/24;G06V10/40;G06V10/764;G06V10/82;G06V10/84
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 高棋
地址: 510090 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 数据 标签 图像 识别 方法
【说明书】:

发明提供一种基于深度学习的含噪数据下的多标签图像识别方法,包括获取多标签含噪数据集并进行预处理;建立双分支多标签修正神经网络模型;将预处理后的多标签含噪数据集输入双分支多标签修正神经网络模型中进行对比学习训练,获得优化后的双分支多标签修正神经网络模型;获取待修正的含噪图片,利用优化后的双分支多标签修正神经网络模型对待修正的含噪图片进行修正,根据修正标签对待修正的含噪图片进行图像识别;本发明能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用;同时预测结果更具有鲁棒性;另外,本发明根据对训练图片的预测值规定了上下界,能够减弱噪声,避免对噪声的过拟合。

技术领域

本发明涉及计算机视觉和图像多标签分类技术领域,更具体地,涉及一种基于深度学习的含噪数据下的多标签图像识别方法。

背景技术

随着互联网技术的不断发展,人工智能技术日益成熟,深度学习已经成为人工智能技术中最火的分支之一。深度学习因其性能表现优异,框架丰富、调用方便、入门简单而备受欢迎。然而,传统的深度学习算法需要大量人工标注的样本作为数据集,这些数据集通常样本量巨大,常多达上万甚至数十万个样本,且要求每个样本的标签准确无误。因此,制作适于训练的优质数据集需要很大的人力和资金成本,给深度学习的进一步发展带来较大的阻碍。另一方面,互联网上存在大量含有标签噪声的数据,即部分数据的标签是错误的,利用爬虫可以很方便地获得这些数据。传统的深度学习算法只能利用干净的、标签正确的数据进行训练,对于多标签含噪数据,传统的深度学习算法并不能利用这些数据,从而造成数据资源的浪费。

以橘子图片的识别为例,网络上有许多标签为“橘子”的图片,通过对这些图片进行分析后发现,有许多图片是错误标注的,如把与橘子形状、外观相似的柠檬的图片标注为“橘子”,将这类错误标注称为第一类错误标注;又或者将与橘子相去甚远的物体,如橘黄色的夕阳标注为“橘子”,将这类错误标注称为第二类错误标注。如果直接将这些带有错误标签的数据用于训练传统的深度学习网络,网络将会学习到许多错误的数据,导致模型的泛化效果很差,难以落地应用。面对这种情况,有两种方法进行改善:其一是人工重新为图片标注,这将耗费极大的人力物力;其二是直接丢弃这部分数据集,而这也白白浪费了数据资源。

因此,如何方便地利用这些含噪数据集来训练神经网络,是深度学习未来发展急需解决的问题之一,也是大数据时代发展的趋势。

目前的现有技术公开了一种基于元学习的弱监督图像多标签分类方法,通过提出一个基于标签信息增强的图像多标签分类模型,采用编码-解码架构的神经网络,以序列标注的形式,依次判断标签序列中的标签是否相关,获得图像的相关标签;应对弱监督环境存在的监督信息不足导致模型过拟合现象,还提出了基于元学习的教师-学生网络架构训练方法,进一步提高图像标注的准确率;现有技术中方法只侧重于解决因标签缺失而无法有效建模的问题,对于无标签或标签错误的图片无法进行有效修正,对于含有大量噪声和错误标签的数据集标注的准确率也较低。

发明内容

本发明为克服上述现有技术在对含有多种噪声标签的数据集进行修正时效果不佳的缺陷,提供一种基于深度学习的含噪数据下的多标签图像识别方法,能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用。

为解决上述技术问题,本发明的技术方案如下:

一种基于深度学习的含噪数据下的多标签图像识别方法,包括以下步骤:

S1:获取多标签含噪数据集并进行预处理,具体方法为:

根据预设的K个多标签分类类别获取多标签含噪数据集;

将获得的多标签含噪数据集划分为训练集和验证集,所述训练集包括N张图片,每张图片标注有伪标签,将训练集记为X;将训练集再次划分为两个图片数量相等的第一子训练集D1和第二子训练集D2,其中,,,,表示第i张图片及其对应的伪标签;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310299402.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top