[发明专利]基于反标签学习的半监督少样本图像分类学习方法及系统在审
申请号: | 202211106572.9 | 申请日: | 2022-09-12 |
公开(公告)号: | CN115439715A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 魏秀参;徐赫洋 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标签 学习 监督 样本 图像 分类 学习方法 系统 | ||
1.一种基于反标签学习的半监督少样本图像分类学习方法,其特征在于,包括以下步骤:
步骤1,构造元任务,使用预训练的神经网络作为特征提取器提取图像数据,提取元任务中支持集、查询集以及无标签数据集对应的特征,并在支持集上训练一个分类器,用于后续图像分类任务;
步骤2,反标签学习模块以第一正确率给无标签图像数据打上反标签,用分类器在反标签上进行学习更新,通过不断迭代直到无法选出反标签;
步骤3,正标签学习模块得到类别均衡且满足第二正确率的正标签,并用分类器进行学习更新;
步骤4,用训练好的分类器在查询集上预测得到最后图像分类的类别结果。
2.根据权利要求1所述的基于反标签学习的半监督少样本图像分类学习方法,其特征在于,步骤1中,利用预训练的卷积神经网络模型提取元任务中支持集、查询集以及无标签图像数据集的特征,接着在支持集的特征上训练一个分类器,具体如下:
通过卷积神经网络提取元任务中对应图像数据集合的特征:
xset∈{S,Q,U}=F(I;θr) (1)
其中I为输入数据,F(·;θr)为预训练的卷积神经网络模型,θr为该模型的参数;xset为set集合提取出来的特征,set取S、Q或U,分别代表支持集、查询集以及无标签数据集;
初始化分类器f(·;θc),其中θc为该分类器参数;用分类器将xS映射到对应的概率空间:
ps=f(xS;θc) (2)
使用交叉熵损失进行训练,其中交叉熵损失表示如下:
3.根据权利要求2所述的基于反标签学习的半监督少样本学习方法,其特征在于,构建反标签学习模块,该模块以迭代的方式,通过对无标签数据的处理挑选出反标签并用于分类器的学习,直到无法挑选出符合条件的数据则迭代结束;
首先,使用分类器f(·;θc),将无标签数据映射到类别的概率空间:
PU=f(xU;θc) (4)
其中xU为公式(1)中得到的无标签数据特征,pU为无标签数据经过分类器映射后得到的类别后验概率值,上标U代表无标签数据;
进行反标签学习模块的第一轮迭代,挑选反标签方法如下:
其中k代表pU中概率最小的对应的位置,即对应概率最小的类别,为对应类别的概率值,δ作为挑选反标签的阈值,为当前输入数据的反标签,即当概率最小类别的概率值小于该阈值时,反标签取1,此时反标签类别为k,当不满足条件时该样本不参与本轮的迭代;
经过第一轮迭代,得到无标签数据中被标记上反标签数据的集合其中i表示挑选出来的反标签数据的下标,这里Nj为第j次迭代中按照公式(5)挑选出数据的数量,其中j代表迭代的次数;和分别代表挑选出的第i个数据的特征向量以及对应的反标签;
反标签学习模块中,设计迭代挑选反标签的策略,对于一个输入数据,已经标记过的反标签类别,在之后的迭代过程中将不再考虑该类别;定义一个列表记录每个数据在每次迭代中挑选的反标签:
其中为本次迭代中满足条件的样本标记的反标签,有些样本无法满足条件,因此将一些列表中设置为空;M为无标签数据集U的数据量,类别数为C,即
将交叉熵损失函数进行修改,使其能够用来在上训练分类器f(·;θc),形式如下:
至此第一轮迭代结束,接着循环前述步骤,直到在迭代中无法挑选出满足条件的反标签数据,即迭代停止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211106572.9/1.html,转载请声明来源钻瓜专利网。