[发明专利]一种基于深度学习的含噪数据下的多标签图像识别方法有效
申请号: | 202310299402.5 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116012569B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 陈添水;徐志华;黄衍聪;柯梓铭;付晨博;范耀洲;杨志景 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V10/20 | 分类号: | G06V10/20;G06N3/08;G06V10/24;G06V10/40;G06V10/764;G06V10/82;G06V10/84 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 高棋 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 数据 标签 图像 识别 方法 | ||
本发明提供一种基于深度学习的含噪数据下的多标签图像识别方法,包括获取多标签含噪数据集并进行预处理;建立双分支多标签修正神经网络模型;将预处理后的多标签含噪数据集输入双分支多标签修正神经网络模型中进行对比学习训练,获得优化后的双分支多标签修正神经网络模型;获取待修正的含噪图片,利用优化后的双分支多标签修正神经网络模型对待修正的含噪图片进行修正,根据修正标签对待修正的含噪图片进行图像识别;本发明能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用;同时预测结果更具有鲁棒性;另外,本发明根据对训练图片的预测值规定了上下界,能够减弱噪声,避免对噪声的过拟合。
技术领域
本发明涉及计算机视觉和图像多标签分类技术领域,更具体地,涉及一种基于深度学习的含噪数据下的多标签图像识别方法。
背景技术
随着互联网技术的不断发展,人工智能技术日益成熟,深度学习已经成为人工智能技术中最火的分支之一。深度学习因其性能表现优异,框架丰富、调用方便、入门简单而备受欢迎。然而,传统的深度学习算法需要大量人工标注的样本作为数据集,这些数据集通常样本量巨大,常多达上万甚至数十万个样本,且要求每个样本的标签准确无误。因此,制作适于训练的优质数据集需要很大的人力和资金成本,给深度学习的进一步发展带来较大的阻碍。另一方面,互联网上存在大量含有标签噪声的数据,即部分数据的标签是错误的,利用爬虫可以很方便地获得这些数据。传统的深度学习算法只能利用干净的、标签正确的数据进行训练,对于多标签含噪数据,传统的深度学习算法并不能利用这些数据,从而造成数据资源的浪费。
以橘子图片的识别为例,网络上有许多标签为“橘子”的图片,通过对这些图片进行分析后发现,有许多图片是错误标注的,如把与橘子形状、外观相似的柠檬的图片标注为“橘子”,将这类错误标注称为第一类错误标注;又或者将与橘子相去甚远的物体,如橘黄色的夕阳标注为“橘子”,将这类错误标注称为第二类错误标注。如果直接将这些带有错误标签的数据用于训练传统的深度学习网络,网络将会学习到许多错误的数据,导致模型的泛化效果很差,难以落地应用。面对这种情况,有两种方法进行改善:其一是人工重新为图片标注,这将耗费极大的人力物力;其二是直接丢弃这部分数据集,而这也白白浪费了数据资源。
因此,如何方便地利用这些含噪数据集来训练神经网络,是深度学习未来发展急需解决的问题之一,也是大数据时代发展的趋势。
目前的现有技术公开了一种基于元学习的弱监督图像多标签分类方法,通过提出一个基于标签信息增强的图像多标签分类模型,采用编码-解码架构的神经网络,以序列标注的形式,依次判断标签序列中的标签是否相关,获得图像的相关标签;应对弱监督环境存在的监督信息不足导致模型过拟合现象,还提出了基于元学习的教师-学生网络架构训练方法,进一步提高图像标注的准确率;现有技术中方法只侧重于解决因标签缺失而无法有效建模的问题,对于无标签或标签错误的图片无法进行有效修正,对于含有大量噪声和错误标签的数据集标注的准确率也较低。
发明内容
本发明为克服上述现有技术在对含有多种噪声标签的数据集进行修正时效果不佳的缺陷,提供一种基于深度学习的含噪数据下的多标签图像识别方法,能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用。
为解决上述技术问题,本发明的技术方案如下:
一种基于深度学习的含噪数据下的多标签图像识别方法,包括以下步骤:
S1:获取多标签含噪数据集并进行预处理,具体方法为:
根据预设的K个多标签分类类别获取多标签含噪数据集;
将获得的多标签含噪数据集划分为训练集和验证集,所述训练集包括N张图片,每张图片标注有伪标签,将训练集记为X;将训练集再次划分为两个图片数量相等的第一子训练集D1和第二子训练集D2,其中,,,,表示第i张图片及其对应的伪标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310299402.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置