[发明专利]一种基于循环更新模式的决策树构建方法在审
申请号: | 201510277941.4 | 申请日: | 2015-05-27 |
公开(公告)号: | CN104866314A | 公开(公告)日: | 2015-08-26 |
发明(设计)人: | 贾靓 | 申请(专利权)人: | 常州大学 |
主分类号: | G06F9/44 | 分类号: | G06F9/44 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 213164 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 更新 模式 决策树 构建 方法 | ||
技术领域
本发明涉及一种基于循环更新模式的决策树构建方法。
背景技术
用于构建决策树的计算方法的数量和种类很多,这些算法大多着眼于决策树端点数和决策树高度等决策树复杂度进行构建,其种类大致可分为动态规划,增量算法,贪婪算法等。根据S.Hussain,“Total path length and number of terminal nodes for decision trees”,ProcediaComput.Sci.,vol.35,pp.514-521,2014.的研究,对于一般的决策表,通常无法构建具有所有复杂度最小化的决策树。这种无法最小化所有复杂度的情况属于多目标最优化理论的范畴,但与多目标最优化中可行空间可被显式探索不同,决策树复杂度的可行空间通过决策树与子决策树间的关系进行探索。由于决策树复杂度可行空间的隐式探索方式,决策树算法一般只对决策表进行一次性分析。这种构建决策表的模式,既脱离现实应用的实际需要,又常常无法得到具有复杂度理论上最优化的决策树。虽然在数据挖掘中,存在根据决策树应用情况修改决策表的算法,例如D.M.Farid,L.Zhang,C.M.Rahman,M.A.Hossain,R.Strachan,Hybrid decision tree andBayes classifiers for multi-class classification tasks,Expert Syst.with Applicat.,vol.41,no.4,pp.1937-1946,Mar.2014.,但建立在一次性删减决策表内部信息的基础上。这种修改决策表的方式,既不能保证决策表的信息完整,又无法根据实际应用做进一步的决策树优化。因此,为更符合实际应用需求,提升应用决策树系统的自动决策效率,生成决策树的过程应考虑应用需求,从而保证良好的决策效率。
发明内容
本发明要解决的技术问题是:为了提升应用决策树系统的自动决策效率,生成决策树的过程紧密结合应用需求,从而保证良好的决策效率,本发明提供一种基于循环更新模式的决策树构建方法。
为使陈述清楚明了,现集中定义本发明所涉及的部分符号和概念。
{·}≠表示一集合,且其中的任一元素均不与集合中的其他元素重复。
{·}表示一任意集合。
|{·}|≠表示集合{·}中含有不同元素的种类数。
|{·}|表示集合{·}中元素的数量。
Z+表示不包括零的正整数集合。
R+表示不包括零的正实数集合。
Rn表示n∈Z+的n维实向量空间。
“max{元素|条件}”或“max条件元素”表示满足条件的最大元素。
“min{元素|条件}”或“min条件元素”表示满足条件的最小元素。
T0表示对本发明方案给定的初始决策表。
T表示对本发明方案中每次输入程序的决策表。
T‘表示任意非空的决策表,以下对T‘的相关定义与描述均适用于T0和T。
E(T‘)表示T‘中的条件属性集合,且满足E(T‘)={E(T‘)}≠。
C(T‘)表示T‘中的条件值集合的集合。
D(T‘)表示T‘中的决策值集合。决策值即“决策属性值(values of decision attributes)”,又称“决策特征值”,或“决策属性值”,本申请中简称为“决策值”。
f1,f2,…,f|E(T‘)|∈E(T‘)表示T‘的共|E(T‘)|个条件属性。
{c11,c12,…,c1|E(T‘)|},{c21,c22,…,c2|E(T‘)|},…,{c|C(T‘)|1,c|C(T‘)|2,…,c|C(T‘)|·|E(T‘)|}∈C(T‘)表示T‘的共|C(T‘)|个条件值集合,对于C(T‘)中任意条件值集合,其元素均为条件值且属于Rn。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510277941.4/2.html,转载请声明来源钻瓜专利网。