[发明专利]一种核集成优化分类方法无效
申请号: | 201110077910.6 | 申请日: | 2011-03-30 |
公开(公告)号: | CN102142091A | 公开(公告)日: | 2011-08-03 |
发明(设计)人: | 丁永生;程丽俊;郝矿荣;胡一帆;沈懿珍;任龙 | 申请(专利权)人: | 东华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 201620 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集成 优化 分类 方法 | ||
1.一种核集成优化分类方法,其特征是依次包括以下步骤:
(1)用户提交分类请求的数据给数据预处理模块;数据预处理模块对数据进行缺失数据估算填补,识别离群点,剔除不一致性数据,最后数据归一化处理,并将数据随机分成四份,前三份作为分类训练数据,最后一份作为分类测试数据;
(2)用户从核函数库中选择核主分量分析核函数和支持向量的核函数,其中核函数库有线性核函数、多项式核函数、径向基核函数、谱核函数和Sigmoid核函数,默认选择核主分量分析核函数为径向基核函数,核函数初值为1;默认选择支持向量机的核函数为线性核函数;
(3)将预处理后那三份分类训练数据,借助已经选择的核函数,在高维特征空间中,给定核函数参数以及主元个数选定个数的初值(主元个数为整数,且1<主元个数<训练样本个数),用核主分量分析,去除复共线性与冗余信息,获取训练样本在主分量上投影,作为分类鉴别模型的输入;
(4)在高维特征空间中,给定支持向量机核函数参数初值、惩罚因子C初值,利用支持向量机分类器,对训练样本已在核主分量分析主分量上投影值进行分类训练,获得分类超平面其中sgn是符号函数,为非零支持向量;K(xi,x)为核函数;yi为输入的原分类值;xs为一个特定的非零支撑向量;
(5)基于免疫克隆优化算法调整整体参数,包括核主分量分析核参数,核主分量分析中主元个数m,以及支持向量机中核参数和惩罚因子C,获取最佳分类参数组合,输出最优分类超平面;具体过程:随机产生规模为s个A(k)=(v1,v2,v3,v4)的抗体群,其中v1为核主分量分析中核参数,v2表示核主分量分析中选取的主元个数m,v3表示支持向量机中核参数,v4表示支持向量机中惩罚因子C;定义抗体的适应度函数:其中w为分类准确率,为核主分量分析中累计方差贡献率,m为核主分量分析中主元个数;增加基于浓度的调节因子pi,对抗体的浓度进行调节,保持种群中个体的多样性;
在此,pf为适应度概率;pd为浓度抑制概率;μ和v为调节常数,这里取μ=0.8,v=12;N为抗体总数;Ci为抗体浓度(相似抗体所占的比重);于是,每个个体克隆个数就有ni=Nsin(π*pi/2);对当代种群进行交叉、变异操作后,选择适应度最大的前s个个体,进入下一代种群,如此循环,直到适应度值稳定在最大适应度与最小适应度值差小于0.01时,具有最大适应度的个体所对应的参数组合即为最佳分类参数组合,其对应的分类超平面即为最优分类超平面;
(6)将分类测试数据投影到(3)中主分量向量上,获得其投影值,然后输入到最优分类超平面f(x)中,如果最优分类超平面判别结果同已给的类别符号一致,则判别和预测即为正确,获得其分类准确率=测试正确数/整体测试样本数;
(7)如果预测分类准确率小于80%,用户重新选择核主分量分析核函数和支持向量机的核函数,系统自动从(2)~(6)执行,直至最优分类超平面和新的预测准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110077910.6/1.html,转载请声明来源钻瓜专利网。