[发明专利]一种诱导式非负投影半监督数据分类方法及系统有效
申请号: | 201711140254.3 | 申请日: | 2017-11-16 |
公开(公告)号: | CN107766895B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 张召;贾磊;李凡长;王邦军;张莉 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 陶海锋 |
地址: | 215137 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 诱导 式非负 投影 监督 数据 分类 方法 系统 | ||
1.一种诱导式非负投影半监督数据分类方法,其特征在于,包括如下步骤:
(1)、随机的将原始数据集划分为训练集和测试集,然后对所述训练集和测试集进行初始化,获得初始类别标签矩阵;所述原始数据集为人脸图像数据集;
(2)、利用投影非负矩阵分解技术对原始数据进行重新表示,计算得到一个投影非负矩阵分解结果Q,基于新表示的数据建立联合统一的标签传播框架,进行自适应权重构造和标签传播,同时最小化数据重构项和标签重构项,通过迭代得到训练集的非负矩阵Q以及投影分类器P;
(3)、利用学习得到非负矩阵Q以及投影分类器P,对测试集中的无标签样本数据进行投影,得到类别标签向量,根据标签向量中的最大值确定测试样本对应的标签类别,得到分类结果。
2.根据权利要求1所述的诱导式非负投影半监督数据分类方法,其特征在于,步骤(1)具体包括:
原始的样本数据集合划分为训练集和测试集,所述训练集中包含已标记的训练样本和尚未标记的训练样本,已标记和未标记的训练数据向量集合X=[XL,XU]∈n×(l+u)(其中,n是训练数据的维度,l是已标记训练样本的数量,u是未标记训练样本数量),其中包含有c(c2)个类别标签的训练样本集XL=[x1,x2,...,xl]∈n×l和无任何标签的训练样本集XU=[xl+1,xl+2,...,xl+u]∈n×u,其中l+u=N,所述测试集中包含测试样本,全部未标记,初始化训练集的类别标签矩阵,Y=[y1,y2,…,yl+u],对于已标记样本xj,假定xj属于第i类,则yi,j=1,反之,yi,j=0.若xj未被标记,则yi,j=0。
3.根据权利要求1所述的诱导式非负投影半监督数据分类方法,其特征在于,步骤(2)中框架如下:
其中,是重构误差项,是流行平滑项,为自适应编码项,同时最小化数据重构项和标签重构项,确保得到的权重对于标签传播是最优的。
4.根据权利要求1所述的诱导式非负投影半监督数据分类方法,其特征在于,步骤(3)具体包括:利用前一步骤得到的非负矩阵Q和投影分类器P将待测样本嵌入计算得到每个测试样本的软标签向量,软标签向为f=PTQQTx∈c×1,所得软标签向量的最大元素对应的位置即为待测样本的软标签,每个测试样本的硬标签可以被归结为argmaxi≤c(f)i,其中(f)i表示预测的软标签向量f第i个元素位置。
5.一种诱导式非负投影半监督数据分类系统,其特征在于,包括:
训练预处理模块,随机的将原始数据集划分为训练集和测试集,然后对所述训练集和测试集进行初始化,获得初始类别标签矩阵;
训练模块,对预处理后的数据利用投影非负矩阵分解技术对原始数据进行重新表示,计算得到一个投影非负矩阵分解结果Q,基于新表示的数据建立联合统一的标签传播框架,进行自适应权重构造和标签传播,同时最小化数据重构项和标签重构项,通过迭代训练得到训练集的非负矩阵Q以及投影分类器P;
测试模块,利用学习得到非负矩阵Q以及投影分类器P,对测试集中的无标签样本数据进行投影,得到类别标签向量,根据标签向量中的最大值确定测试样本对应的标签类别,得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711140254.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可吸附在墙面上的搓澡垫
- 下一篇:一种基于色相聚类的光谱降维方法