[发明专利]一种小样本决策树分类器构造中的连续属性分割方法有效
申请号: | 201210073278.2 | 申请日: | 2012-03-19 |
公开(公告)号: | CN102622612A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 张德贤;许伟涛;于俊伟;刘灿;王洪群;杨卫东;李保利;张苗;梁义涛;靳小波 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 陈浩 |
地址: | 450001 河南省郑州市高新技术*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种小样本决策树分类器构造中的连续属性分割方法,包括连续属性分割点数确定和分割位置优化两部分;首先由训练样本集,构造SVM分类面模型,确定其边界点,选择合理异类边界点对,并计算各合理异类边界点对连线上的分类面点;对于连续属性,根据所有分类面点的分类间隔分布确定连续分割点数和初始分割位置;根据所有分类面模型的分类面点,对于每个SVM分类面模型,计算属性分割面与该SVM分类面的逼近误差,并对所有SVM分类面的逼近误差进行融合,进而以逼近误差为目标优化连续属性分割位置;本发明的方法具有属性分割点数与位置选择快速准确等特点,可显著减少所构造决策树的大小,提高决策树的预测精度。 | ||
搜索关键词: | 一种 样本 决策树 分类 构造 中的 连续 属性 分割 方法 | ||
【主权项】:
1.一种小样本决策树分类器构造中的连续属性分割方法,其特征在于,该方法的步骤如下:(1)根据训练样本集,构造SVM分类面模型;(2)确定SVM分类面的边界点,根据分类面点沿SVM分类面均匀分布的原则,选择合理异类边界点对,并计算各合理异类边界点对连线上的分类面点;(3)采用现有的属性选择方法选择优先扩展属性,若无扩展属性则结束,否则转步骤(4);(4)根据所有分类面模型的分类面点,对于离散属性,其取值点即为分割点,转步骤(3);对于连续属性,确定连续分割点数和初始分割位置;(5)根据所有分类面模型的分类面点,对于每个SVM分类面模型,依该模型的决策面点和决策面与分割面的逼近误差,计算属性分割面与该SVM分类面的逼近误差E(Modeli),并依
或
进行逼近误差E(Modeli)融合;(6)采用带约束复合型优化方法进行连续属性分割位置优化,转步骤(3)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210073278.2/,转载请声明来源钻瓜专利网。