[发明专利]一种小样本决策树分类器构造中的连续属性分割方法有效
申请号: | 201210073278.2 | 申请日: | 2012-03-19 |
公开(公告)号: | CN102622612A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 张德贤;许伟涛;于俊伟;刘灿;王洪群;杨卫东;李保利;张苗;梁义涛;靳小波 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 陈浩 |
地址: | 450001 河南省郑州市高新技术*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 决策树 分类 构造 中的 连续 属性 分割 方法 | ||
1.一种小样本决策树分类器构造中的连续属性分割方法,其特征在于,该方法的步骤如下:
(1)根据训练样本集,构造SVM分类面模型;
(2)确定SVM分类面的边界点,根据分类面点沿SVM分类面均匀分布的原则,选择合理异类边界点对,并计算各合理异类边界点对连线上的分类面点;
(3)采用现有的属性选择方法选择优先扩展属性,若无扩展属性则结束,否则转步骤(4);
(4)根据所有分类面模型的分类面点,对于离散属性,其取值点即为分割点,转步骤(3);对于连续属性,确定连续分割点数和初始分割位置;
(5)根据所有分类面模型的分类面点,对于每个SVM分类面模型,依该模型的决策面点和决策面与分割面的逼近误差,计算属性分割面与该SVM分类面的逼近误差E(Modeli),并依或进行逼近误差E(Modeli)融合;
(6)采用带约束复合型优化方法进行连续属性分割位置优化,转步骤(3)。
2.根据权利要求1所述的方法,其特征在于:所述步骤(1)中构造SVM分类面模型的方式为:对于多分类问题的每个类别,构造该类与其它类别所组成的2分类SVM分类面模型Modeli,i=1,2,...,C,其中,C为类别数;对于2分类问题,则仅构造1个SVM分类面模型。
3.根据权利要求2所述的方法,其特征在于,所述步骤(1)中对于给定的训练样本集其中xm∈Rn为第m个样本点的属性值向量,ym∈{-1,+1}为相应的二分类类别标号,则SVM分类面模型可表示为
其中,γ为大于0的参数;βj,b为通过SVM训练所获得的参数,βj≠0;xj为相应的支持向量点,j=1,...,l,l为支持向量点数。
4.根据权利要求3所述的方法,其特征在于,所述步骤(2)中对于给定的训练样本集S,其边界点集合SB可定义为
SB={x|x∈S,|Z(x)|<θ,θ<0} (2)
其中θ为给定的边界点的分类值门限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210073278.2/1.html,转载请声明来源钻瓜专利网。