[发明专利]一种基于循环更新模式的决策树构建方法在审
申请号: | 201510277941.4 | 申请日: | 2015-05-27 |
公开(公告)号: | CN104866314A | 公开(公告)日: | 2015-08-26 |
发明(设计)人: | 贾靓 | 申请(专利权)人: | 常州大学 |
主分类号: | G06F9/44 | 分类号: | G06F9/44 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 213164 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 更新 模式 决策树 构建 方法 | ||
1.一种基于循环更新模式的决策树构建方法,其特征在于:包括以下步骤:
步骤1:根据给定的初始决策表计算基于决策树时空复杂度的目标函数帕累托最优值;
步骤2:根据步骤1计算所得目标函数帕累托最优值,结合贝叶斯理论,计算决策表中每行的贝叶斯概率,根据计算所得的贝叶斯概率修改初始决策表;
步骤3:根据所修改的决策表构建初始决策树;在应用初始决策树的信息系统中,在满足决策树应用数据可回收并能计算决策表每行决策频率的前提下,根据决策频率修改决策表,根据所修改的决策表构建新决策树;
步骤4:在信息系统中应用新决策树,再回收并分析新决策树的应用数据,如此反复直至当前决策变化率小于给定的决策变化率阀值时终止,从而循环更新决策树。
2.如权利要求1所述的基于循环更新模式的决策树构建方法,其特征在于:步骤1中帕累托最优值的定义如下:
若k6∈Z+,分别表示和的取值范围,定义如下映射
且
其中用图表示任意非空的决策表T‘及其与子表,以及子表与子表之间的关系时,图的节点代表子表T‘(v)=T′v,从包含属性fi∈E(T′v)的节点T′v出发,指向节点T′v(fi,ak),ak∈C(T‘,fi),k∈Z+,k=1,…,|C(T′v,fi)|的边用(fi,ak)标识;图中的边是有向的,且连接了一个表及其子表,图是有向非循环图(directed acyclic graph,DAG),对于节点T′v∈DAG,|D(T′v)|≠其存在以下两种情况:
当|D(T′v)|≠=1,对于任意T′v中的行rj∈C(T′v),rj与所有行共享一个公共的决策值,此时,T′v是DAG的叶子节点,且
当|D(T′v)|≠>1,rj∈C(T′v)根据其对应的决策值分类,从节点T′v开始,对于任意fi∈E(T′v),若则存在被(fi,a1),(fi,a2),…,标识的数量为|C(T′v,fi)|的边分别指向节点T′v(fi,a1),对于每个T′v(fi,ak),都存在对应的
对于fi∈E(T′v),由其中组成的所有可能组合构成了如下定义的有序集合,
其中v=[1…1]T,*表示内积,且vk′*v<vk′+1*v其中k′=i,i+1,…,i+|C(T′v)|-1,令kmax≤|C(T′v,fi)|,vi定义如下:
对于vi≠vk″,i+1≤k″≤|C(Tv)|,k″∈Z+,vk″定义如下:
对于T′v(fi,ak),可求得的值;对于基于决策树的时空复杂度且关于属性fi∈E(T′v)的目标函数定义如下:
其中vk′(k)表示向量vk′中第k个元素;根据关于E(T′v)的,用于描述子表T′v时空复杂度的目标函数帕累托最优值的定义如下:
如果T′v是图的叶子节点,则且帕累托最优点为如果T′v不是叶子节点,则对于每个fi∈E(T′v)计算并选计算所得的最小值作为的值,此时帕累托最优点为其中是用于找到生成的的函数;对于决策树的时空复杂度的多目标最优化,目标空间是基于函数和值的二维空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510277941.4/1.html,转载请声明来源钻瓜专利网。