[发明专利]一种融合增量学习的支持向量机多类分类方法无效
申请号: | 201010289451.3 | 申请日: | 2010-09-17 |
公开(公告)号: | CN101944122A | 公开(公告)日: | 2011-01-12 |
发明(设计)人: | 琚春华;郑丽丽;梅铮 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 韩小燕 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 增量 学习 支持 向量 机多类 分类 方法 | ||
1.一种融合增量学习的支持向量机多类分类方法,其特征在于包括步骤:
步骤1、在总的样本中随机抽取一部分作为训练样本集D,另一部分作为测试样本集T;
步骤2、对训练样本集D进行预抽取支持向量,获得最终的预抽取训练样本集PTS,剩下的训练样本作为增量样本集B0;
步骤3、用循环迭代法对预抽取训练样本集PTS进行支持向量机训练,得到多类分类模型M-SVM;
步骤4、对多类分类模型M-SVM进行二叉树处理,得到基于二叉树的支持向量机多类分类模型BTMSVM0;
步骤5、对多类分类模型BTMSVM0进行增量学习训练,得到新的多类分类模型BTMSVM1;
步骤6、将步骤1中的测试样本集T输入到多类分类模型BTMSVM1进行分类。
2.根据权利要求1所述的融合增量学习的支持向量机多类分类方法,其特征在于步骤2中所述的预抽取支持向量按以下步骤进行:
2.1、对K类样本根据各类样本的数量进行由多到少排序,训练样本中出现最多的类为第1类,以此类推,直至第K类,形成分类序列集合{s1,s2...sk};
2.2、确定训练样本的类型,对于K类的训练样本,训练K-1个支持向量机,第i个支持向量机以第i类样本为正的训练样本,将第i+1,i+2.....K类训练样本作为负的训练样本训练SVM(i)(i=1....K-1),第K-1个支持向量机将以第K-1类样本作为正样本,以第K类样本为负样本训练SVM(K-1);
2.3、从训练样本集D中的第i类样本集中选取一个样本,根据类均值距离法求其与第i+1类所有样本间的距离δi,j(i=1,2...k,j=1,2,...k):
δi,j=||mi-mj||2-ri-rj
其中表示第i类样本集的均值向量,||mi-mj||2为i类和j类均值向量间的距离,ri和rj分别为i类及j类的类平均半径,ni为i类中的样本数目,称δi,j为i类和j类之间的类均值距离;
2.4、找出这些距离中的最小值及与这个最小距离所对应的第i+1类中的样本,将其放在预抽取样本集合PTS0中;
2.5、返回到步骤2.3,遍历完训练样本集D中第i类中的所有样本;
2.6、返回到步骤2.1,遍历完训练样本集D中第i+1类中的所有样本;
2.7、对预抽取样本集合PTS0中的样本做唯一化处理,获得最终的预抽取训练样本集合PTS。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010289451.3/1.html,转载请声明来源钻瓜专利网。