[发明专利]基于反标签学习的半监督少样本图像分类学习方法及系统在审

申请号：	202211106572.9	申请日：	2022-09-12
公开（公告）号：	CN115439715A	公开（公告）日：	2022-12-06
发明（设计）人：	魏秀参;徐赫洋	申请（专利权）人：	南京理工大学
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/764;G06V10/82
代理公司：	南京理工大学专利中心 32203	代理人：	陈鹏
地址：	210094 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于标签学习监督样本图像分类学习方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于反标签学习的半监督少样本图像分类学习方法，其特征在于，包括以下步骤：

步骤1，构造元任务，使用预训练的神经网络作为特征提取器提取图像数据，提取元任务中支持集、查询集以及无标签数据集对应的特征，并在支持集上训练一个分类器，用于后续图像分类任务；

步骤2，反标签学习模块以第一正确率给无标签图像数据打上反标签，用分类器在反标签上进行学习更新，通过不断迭代直到无法选出反标签；

步骤3，正标签学习模块得到类别均衡且满足第二正确率的正标签，并用分类器进行学习更新；

步骤4，用训练好的分类器在查询集上预测得到最后图像分类的类别结果。

2.根据权利要求1所述的基于反标签学习的半监督少样本图像分类学习方法，其特征在于，步骤1中，利用预训练的卷积神经网络模型提取元任务中支持集、查询集以及无标签图像数据集的特征，接着在支持集的特征上训练一个分类器，具体如下：

通过卷积神经网络提取元任务中对应图像数据集合的特征：

x^{set∈{S,Q，U}}＝F(I；θ_r) (1)

其中I为输入数据，F(·；θ_r)为预训练的卷积神经网络模型，θ_r为该模型的参数；x^set为set集合提取出来的特征，set取S、Q或U，分别代表支持集、查询集以及无标签数据集；

初始化分类器f(·；θ_c)，其中θ_c为该分类器参数；用分类器将x^S映射到对应的概率空间：

p^s＝f(x^S；θ_c) (2)

使用交叉熵损失进行训练，其中交叉熵损失表示如下：

3.根据权利要求2所述的基于反标签学习的半监督少样本学习方法，其特征在于，构建反标签学习模块，该模块以迭代的方式，通过对无标签数据的处理挑选出反标签并用于分类器的学习，直到无法挑选出符合条件的数据则迭代结束；

首先，使用分类器f(·；θ_c)，将无标签数据映射到类别的概率空间：

P^U＝f(x^U；θ_c) (4)

其中x^U为公式(1)中得到的无标签数据特征，p^U为无标签数据经过分类器映射后得到的类别后验概率值，上标U代表无标签数据；

进行反标签学习模块的第一轮迭代，挑选反标签方法如下：

其中k代表p^U中概率最小的对应的位置，即对应概率最小的类别，为对应类别的概率值，δ作为挑选反标签的阈值，为当前输入数据的反标签，即当概率最小类别的概率值小于该阈值时，反标签取1，此时反标签类别为k，当不满足条件时该样本不参与本轮的迭代；

经过第一轮迭代，得到无标签数据中被标记上反标签数据的集合其中i表示挑选出来的反标签数据的下标，这里N_j为第j次迭代中按照公式(5)挑选出数据的数量，其中j代表迭代的次数；和分别代表挑选出的第i个数据的特征向量以及对应的反标签；

反标签学习模块中，设计迭代挑选反标签的策略，对于一个输入数据，已经标记过的反标签类别，在之后的迭代过程中将不再考虑该类别；定义一个列表记录每个数据在每次迭代中挑选的反标签：

其中为本次迭代中满足条件的样本标记的反标签，有些样本无法满足条件，因此将一些列表中设置为空；M为无标签数据集U的数据量，类别数为C，即

将交叉熵损失函数进行修改，使其能够用来在上训练分类器f(·；θ_c)，形式如下：

至此第一轮迭代结束，接着循环前述步骤，直到在迭代中无法挑选出满足条件的反标签数据，即迭代停止。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京理工大学，未经南京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211106572.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载