[发明专利]寻找可靠的异常数据中心的半监督少样本图像分类方法在审
申请号: | 201911121653.4 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110942091A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 熊盛武;连洁雅;王豪杰;曹丹凤 | 申请(专利权)人: | 武汉理工大学;武汉水象电子科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 寻找 可靠 异常 数据中心 监督 样本 图像 分类 方法 | ||
本发明公开了一种寻找可靠的异常数据中心的半监督少样本图像分类方法,具体可分为如下步骤:划分数据集;从训练集取样半监督少样本分类任务;利用神经网络提取少样本分类任务样本的特征表示;寻找可靠异常数据聚类中心;利用无标签数据优化各类图像原型;利用原型对任务中待分类样本分类,计算交叉熵损失,反向传播更新网络参数;迭代训练得到理想的特征提取网络;完成半监督少样本分类任务。本发明训练了一个适合于少样本分类的特征提取器,使得在训练数据极少的情况下,分类器仍可以取得较为理想的分类性能。并且在训练时加入了无标签数据,利用寻找可靠的异常数据中心的方法,合理利用无标签数据的信息,提高了分类器的性能。
技术领域
本发明属于深度学习与图像分类技术领域,涉及一种图像分类方法,具体涉及一种寻找可靠的异常数据中心的半监督少样本图像分类方法。
背景技术
近年来,深度学习通过从大量带标签数据中学习知识,训练深层神经网络模型,在计算机视觉,机器翻译,语音建模等任务中都获得了巨大的成功。但训练深层神经网络却需要使用大量带标签数据进行迭代训练,才能达到令人满意的效果。在带标签数据量不足的情况下,传统的深度学习方法就失效了。
为了解决这个问题,少样本学习方法成为了人们关注的热点。少样本学习方法利用元学习的方法,从训练数据中获取一般知识,使得模型在带标签数据量很少的情况下,依然能有很好的泛化性能。
为了进一步提高少样本学习模型的性能,学者们提出了在少样本学习任务中引入无标签数据,使原本的少样本学习任务转变为半监督的少样本学习任务,通过合理利用无标签数据的信息,使得模型性能得到进一步的提升。
现有的方法在解决半监督少样本学习问题时,大都建立在原型网络的基础上。原型网络假设存在一个特征提取器可以将图像映射到一个特有的映射空间(embeddingspace),在这个空间中,每一类图像都存在有原型,待分类样本可以通过与原型进行距离比较得到其分类结果,即K-近邻分类方法。而原型可以由支持集各类样本的均值得到。半监督少样本学习方法在此基础上使用K-Means聚类方法对无标签样本聚类,并通过聚类结果对所得的原型优化。
然而现有方法假设干扰数据(异常数据)的聚类中心处于原点位置,这个假设虽然简单却有不合理之处。
发明内容
为了解决上述背景技术中存在的不足,即假设干扰数据(异常数据)的聚类中心处于原点位置。本发明提出了一种寻找可靠的异常数据中心的半监督少样本图像分类方法。不对干扰数据的中心位置做出假设,而是采用了分析无标签数据信息并从中寻找可靠的异常数据中心的方法。
本发明所采用的技术方案为:一种寻找可靠的异常数据中心的半监督少样本图像分类方法,其特征在于,包括以下步骤:
步骤1:划分数据集;
将数据集划分为训练集Dtrain,测试集Dtest,训练集与测试集包含不同种类的图像,每类样本图像数目不少于预设值N;
步骤2:从训练集中取样半监督少样本分类任务;
从训练集Dtrain中取样半监督少样本分类任务E,包括支持集Dsupport和查询集Dquery以及无标签数据集Dunlabel;将所述半监督少样本分类任务E中包含的图像经过深度神经网络模型的前向传播计算,得到图像的高层特征表示;
步骤3:使用所述图像的高层特征中的支持集Dsupport部分计算各类图像的原型;
步骤4:使用所述各类图像的原型,计算寻找可靠的异常数据聚类中心;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学;武汉水象电子科技有限公司,未经武汉理工大学;武汉水象电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911121653.4/2.html,转载请声明来源钻瓜专利网。