[发明专利]一种C4.5决策树算法下的连续属性度量选择的增量学习方法在审
申请号: | 201610807099.5 | 申请日: | 2016-09-06 |
公开(公告)号: | CN106372671A | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 徐平平;周小蹦;于凌涛 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06N99/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙)32249 | 代理人: | 杨晓玲 |
地址: | 214135 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种C4.5决策树算法下的连续属性度量选择的增量学习方法,采用神经网络中的后向传播算法对C4.5决策树中的连续属性度量选择过程进行改进,形成增量学习过程;介于后向传播算法主要应用于连续属性,所以本发明主要研究的是在连续属性阈值选取改进方面;该方案是在现有技术方案中增加了增量学习的功能,在连续属性阈值方面,摒弃了原先整棵树或者是部分分支的重新计算,这种复杂的,低效的方法,结合后向传播这种高效的学习方案,不仅增加了决策树C4.5的功能,更是一种新的学习方式。 | ||
搜索关键词: | 一种 c4 决策树 算法 连续 属性 度量 选择 增量 学习方法 | ||
【主权项】:
一种C4.5决策树算法下的连续属性度量选择的增量学习方法,其特征在于:采用神经网络中的后向传播算法对C4.5决策树中的连续属性度量选择过程进行改进,形成增量学习过程,具体包括如下步骤:(1)利用C4.5决策树算法对训练集进行训练,生成原C4.5决策树;进入步骤(2);(2)利用原C4.5决策树对已知分类的测试集一中的所有样本进行分类:对分类正确的样本,将样本添加到训练集中并保存,即将样本添加到原C4.5决策树的样本对象数组中,同时将样本的索引号添加到原C4.5决策树的相关叶节点上;对分类错误的样本,将由于同一个连续属性度量选择而导致分类错误的样本归类到该连续属性的候选改进集中,不同连续属性的候选改进集可以存在交集,进入步骤(3);(3)针对某一个连续属性的候选改进集,利用神经网络中的后向传播算法对该连续属性的改进集的权重、初始值和偏倚进行初始化,并添加该连续属性度量选择的阈值;进入步骤(4);(4)根据后向传播过程中的传播误差、偏倚改变量以及反馈值更新该连续属性度量选择的阈值;将更新后的该连续属性度量选择的阈值应用于原C4.5决策树形成新C4.5决策树,同时使用新C4.5决策树和原C4.5决策树分别对已知分类的测试集二进行分类,统计新C4.5决策树的准确率L2和原C4.5决策树的准确率L1,进入步骤(5);(5)根据针对该连续属性设定的学习率X,比较原C4.5决策树和新C4.5决策树的准确率:若则以新C4.5决策树替换原C4.5决策树并保存,否则,维持原C4.5决策树。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610807099.5/,转载请声明来源钻瓜专利网。