[发明专利]一种C4.5决策树算法下的连续属性度量选择的增量学习方法在审

申请号：	201610807099.5	申请日：	2016-09-06
公开（公告）号：	CN106372671A	公开（公告）日：	2017-02-01
发明（设计）人：	徐平平;周小蹦;于凌涛	申请（专利权）人：	东南大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/08;G06N99/00
代理公司：	南京瑞弘专利商标事务所(普通合伙)32249	代理人：	杨晓玲
地址：	214135 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种C4.5决策树算法下的连续属性度量选择的增量学习方法，采用神经网络中的后向传播算法对C4.5决策树中的连续属性度量选择过程进行改进，形成增量学习过程；介于后向传播算法主要应用于连续属性，所以本发明主要研究的是在连续属性阈值选取改进方面；该方案是在现有技术方案中增加了增量学习的功能，在连续属性阈值方面，摒弃了原先整棵树或者是部分分支的重新计算，这种复杂的，低效的方法，结合后向传播这种高效的学习方案，不仅增加了决策树C4.5的功能，更是一种新的学习方式。
搜索关键词：	一种 c4 决策树算法连续属性度量选择增量学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种C4.5决策树算法下的连续属性度量选择的增量学习方法，其特征在于：采用神经网络中的后向传播算法对C4.5决策树中的连续属性度量选择过程进行改进，形成增量学习过程，具体包括如下步骤：(1)利用C4.5决策树算法对训练集进行训练，生成原C4.5决策树；进入步骤(2)；(2)利用原C4.5决策树对已知分类的测试集一中的所有样本进行分类：对分类正确的样本，将样本添加到训练集中并保存，即将样本添加到原C4.5决策树的样本对象数组中，同时将样本的索引号添加到原C4.5决策树的相关叶节点上；对分类错误的样本，将由于同一个连续属性度量选择而导致分类错误的样本归类到该连续属性的候选改进集中，不同连续属性的候选改进集可以存在交集，进入步骤(3)；(3)针对某一个连续属性的候选改进集，利用神经网络中的后向传播算法对该连续属性的改进集的权重、初始值和偏倚进行初始化，并添加该连续属性度量选择的阈值；进入步骤(4)；(4)根据后向传播过程中的传播误差、偏倚改变量以及反馈值更新该连续属性度量选择的阈值；将更新后的该连续属性度量选择的阈值应用于原C4.5决策树形成新C4.5决策树，同时使用新C4.5决策树和原C4.5决策树分别对已知分类的测试集二进行分类，统计新C4.5决策树的准确率L2和原C4.5决策树的准确率L1，进入步骤(5)；(5)根据针对该连续属性设定的学习率X，比较原C4.5决策树和新C4.5决策树的准确率：若则以新C4.5决策树替换原C4.5决策树并保存，否则，维持原C4.5决策树。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610807099.5/，转载请声明来源钻瓜专利网。

上一篇：天然气单一燃料汽车的两用燃料发动机及其控制方法
下一篇：一种带有径向密封片的微小转子

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种C4.5决策树算法下的连续属性度量选择的增量学习方法在审

专利文献下载