[发明专利]一种带噪声标签的长尾分布图像分类方法有效

申请号：	202111059448.7	申请日：	2021-09-10
公开（公告）号：	CN113516207B	公开（公告）日：	2022-01-25
发明（设计）人：	程乐超;茅一宁;冯尊磊;宋明黎	申请（专利权）人：	之江实验室
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/08
代理公司：	杭州浙科专利事务所(普通合伙) 33213	代理人：	孙孟辉;杨小凡
地址：	310023 浙江省杭州市余***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种噪声标签长尾分布图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种带噪声标签的长尾分布图像分类方法，通过样本依赖的松弛间隔损失进行学习，并辅以抗噪声的数据增强策略，用于解决同时具有长尾特征与噪声标签的图像分类问题。根据数据噪声特征，在计算样本函数间隔时引入样本依赖的松弛变量以放宽间隔约束，再根据样本间隔分类计算样本依赖的光滑松弛损失；根据数据长尾特征，实施分阶段调整的数据增强策略，对样本分别进行强增强和弱增强，并在正式训练阶段提供基于松弛损失的样本筛选机制用于筛除噪声数据。本发明实现方法简便，手段灵活，在长尾数据、噪声数据以及同时具有二者特征的训练数据上都取得显著的分类效果的提升。

技术领域

本发明涉及图像分类领域，尤其是涉及噪声标签与长尾分布数据下图像分类的方法。

背景技术

近年来，卷积神经网络（CNN）被广泛应用于计算机视觉领域。在训练数据数量固定的情况下，参数数量的增加导致过拟合现象日益凸显，为了提高总体性能，对精确标注数据的需求也日益增长。然而，获得大量准确标注的样本通常十分昂贵。针对这一点，非专家众包或系统性标签是一种实际解决的方案，然而这容易导致标签的错误标注。许多基准数据集，如ImageNet、CIFAR-10/-100，MNIST，QuickDraw等，都包含3%~10%的噪声标签样本。关于带噪声标签的现有研究，通常侧重于拆分正确标注与错误标注的样本，但是忽略了数据的分布。真实世界中，数据往往呈现长尾分布的特征，数据集中的几个主要类别占据主导地位，而其他类别的数据则数量不足。因此，在当前基于深度神经网络的图像分类任务中，如何对同时具有长尾特征与噪声标签的数据进行分类，以减小在长尾分布下噪声标签的影响，在实际应用中至关重要。

发明内容

为解决现有技术的不足，实现减小长尾分布下噪声标签影响的目的，本发明采用如下的技术方案：

一种带噪声标签的长尾分布图像分类方法，包括如下步骤：

S1，根据数据噪声特征，对每个样本图像及其噪声标签，在样本间隔的基础上，引入松弛变量，形成噪声样本的样本松弛间隔；

所述样本间隔为，类别间隔为，其中表示第个样本的标签为类别，即样本属于类别，相应地，表示所有属于类别的样本的序号的集合；

所述样本松弛间隔为：

其中，表示样本图像及其正确的标签，表示预测函数，用于预测样本图像属于哪一类别，为样本空间，N为样本总数，为个类别的标签集合，表示实数域，表示与不同的噪声标签，及其对应的x，通过预测函数得到的值中，最大的值，，表示最优间隔；传统的DNN分类网络，通常在特征提取器后接一个线性转换层，然而这种策略在拟合对于带噪声的数据时，容易产生分类器陷入线性不可分的情况，因此，本发明提出松弛变量以放宽间隔约束，而引入松弛变量的样本松弛间隔增加了分类预测结果的容忍度；

根据样本间隔，分段计算样本依赖的光滑松弛损失（Slack Loss）；

S2，根据数据长尾特征，实施分阶段调整的数据增强策略（Data Augmentation），对噪声数据集合中的每组采样，对样本图像分别做弱数据增强和强数据增强，得到相应的弱增强数据和强增强数据，将训练分为预热阶段与正式阶段，考虑强数据增强方法对高噪声率数据集的负面影响，本发明将训练阶段的松弛损失分别使用弱增强数据和强增强数据进行计算并相加，以噪声率和作为权重，在预热阶段，直接计算弱增强数据和强增强数据的松弛损失；在正式训练阶段，根据预热阶段的松弛损失大小，筛选松弛出一组样本图像作为纯净数据，筛除剩余噪声数据，并计算松弛损失。在训练的预热阶段注入强数据增强的方法对于低噪声数据集的训练可以提升性能，但当数据集的噪声增加时则会起反作用。相反，预热阶段的弱数据增强可以大幅提升高噪声数据训练的性能。基于这个总结，本发明将模型训练分为两个阶段，在不同阶段调整增强策略。

进一步地，所述S1中的松弛损失为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于之江实验室，未经之江实验室许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111059448.7/2.html，转载请声明来源钻瓜专利网。

上一篇：汤剂煎制参数的决策方法及煎制参数决策模型的训练方法
下一篇：一种电动车换电柜

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种带噪声标签的长尾分布图像分类方法有效

专利文献下载