[发明专利]基于概率粗糙集的决策树生成方法无效
申请号: | 201010181023.9 | 申请日: | 2010-05-24 |
公开(公告)号: | CN101819604A | 公开(公告)日: | 2010-09-01 |
发明(设计)人: | 刘江;林利 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 温国林 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于概率粗糙集的决策树生成方法,步骤为:1)计算决策属性对于条件属性的依赖度;2)对数据进行相对属性约简,获取决策树节点集;3)通过决策树的节点集构造决策树,建立决策树的方式是,让依赖度最大的节点作为根节点,然后对于分支,重新计算剩余节点的依赖度信息,同时选择依赖度最大的节点。本发明最核心的思想就是首先通过相对约简消除没有用的属性,这样就可以得到用于生成决策树的节点。然后始终选择依赖度最大的节点来扩展生成树,最终就生成了我们需要的决策树。本发明能够有效的解决数据噪声问题。 | ||
搜索关键词: | 基于 概率 粗糙 决策树 生成 方法 | ||
【主权项】:
一种基于概率粗糙集的决策树生成方法,其特征在于,包括如下步骤:1)计算决策属性对于条件属性的依赖度首先设置概率下近似中的β,其中0.5<β≤1,通过使用概率下近似公式,计算每一条件属性Xi,对决策属性Y的概率下近似,然后计算决策属性对条件属性的依赖度,其中概率下近似计算公式如下所示, X i ‾ β Y = { x ∈ U | P ( Y / [ x ] Xi ) ≥ β } 则Y对Xi依赖度为, γ X i ( Y ) = k = | X i ‾ β Y | | U | 其中,U代表论域,即全体记录的集合,|U|代表记录的个数;2)对数据进行相对属性约简,获取决策树节点集首先要获得相对核,相对核的计算公式如下,COREQ(P)=∩REDQ(P)然后我们每次在剩余的节点中选择一个条件属性,使得选择此条件属性后对于决策属性的影响最大,也就是决策属性对于当前属性的集合依赖度最大。我们依次增加节点个数,直到获得最大的独立集,从而得到构造决策树所需要节点集;3)通过决策树的节点集构造决策树建立决策树的方式是,让依赖度最大的节点作为根节点,然后对于分支,重新计算剩余节点的依赖度信息,同时选择依赖度最大的节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010181023.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种方便上料的卫生纸卷纸机
- 下一篇:一种胎面垫布自动收卷装置