[发明专利]基于L2;p范数距离度量的GEPSVM分类方法在审
申请号: | 201910161295.3 | 申请日: | 2019-03-04 |
公开(公告)号: | CN109934274A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 於东军;闫贺;戚湧;葛芳 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 马鲁晋 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测试数据集 训练数据集 距离度量 预测模型 范数 归一化操作 分类结果 分类数据 样本数据 预测结果 最优参数 归一化 鲁棒性 有效地 分类 构建 改进 缓和 分割 更新 | ||
1.一种基于L2,p范数距离度量的GEPSVM分类方法,其特征在于,具体步骤为:
步骤1、对待分类数据进行归一化操作;
步骤2、使用交叉验证法将归一化后的数据分为两部分:测试数据集和训练数据集;
步骤3、构建改进的GEPSVM模型,将训练数据集输入改进的GEPSVM模型进行模型训练,在训练过程中通过交叉验证的方法获得最优参数c;
步骤4、更新改进的GEPSVM模型的增广向量和t为迭代次数,确定最优增广向量z1和z2,生成最优改进的GEPSVM分类模型;
步骤5、依次从k个不相交的子样本中选取一个子样本作为测试数据集,其它k-1个作为训练数据集,重复步骤4,直至所有子样本都作为测试数据集和训练数据集被训练为止,总共得到k组最高的分类结果,对k组分类结果求平均值,该平均值为最终的分类结果。
2.根据权利要求1所述的基于L2,p范数距离度量的GEPSVM分类方法,其特征在于,步骤1中对样本数据进行归一化处理的具体公式为:
di=(xi-min(X))/(max(X)-min(X))
式中,X=(x1,x2,...,xn)∈Rn,表示样本数据集,xi,i=1,2,...,n,表示样本数据集中的第i个样本数据,min(X)表示样本数据集中最小的样本数据,max(X)表示样本数据集中最大的样本数据,di表示归一化后的样本数据。
3.根据权利要求1所述的基于L2,p范数距离度量的GEPSVM分类方法,其特征在于,步骤3中构建的改进的GEPSVM模型模型具体为:
其中,p∈(0,2],||·||2表示L2范数距离,e1和e2是相应维度的单位列向量,矩阵A和B分别表示正、负类样本,w1和w2分别表示正、负类样本的权向量,b1和b2分别表示正、负类样本的偏差。
4.根据权利要求1所述的基于L2,p范数距离度量的GEPSVM分类方法,其特征在于,步骤4中更新改进的GEPSVM模型的增广向量和确定最优增广向量z1和z2,生成最优预测模型,具体步骤为:
步骤4.1、设置迭代次数t=0及p=0.1,初始化增广向量和并分别满足和根据和分别计算对角矩阵和其中,对角矩阵和的第i和j个对角元素分别为和
步骤4.2、根据对角矩阵和最优参数c分别计算增广向量和具体计算公式为:
其中,H=[A e1],G=[B e2],I表示相应维度的单位矩阵;
步骤4.3、根据增广向量和分别更新对角矩阵和具体为:
同时根据和更新矩阵和
步骤4.4、若p≤2,更新迭代次数t=t+1及p=p+0.1,0.1为迭代步长,返回步骤4.2,否则停止循环,生成最优的预测模型。
5.根据权利要求4所述的基于L2,p范数距离度量的GEPSVM分类方法,其特征在于,步骤4.1中增广向量和的值分别为:
其中,c是交叉验证选择的系数。
6.根据权利要求1所述的基于L2,p范数距离度量的GEPSVM分类方法,其特征在于,步骤5中k为10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910161295.3/1.html,转载请声明来源钻瓜专利网。