[发明专利]一种基于决策树算法的制造业材料采购分析方法在审
申请号: | 201610438660.7 | 申请日: | 2016-06-16 |
公开(公告)号: | CN106611283A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 姜艾佳;胡成华 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 算法 制造业 材料 采购 分析 方法 | ||
1.一种基于决策树算法的制造业材料采购分析方法,该方法涉及企业管理领域,其特征是,包括如下步骤:
步骤1:计算属性的信息熵:把采购的供应商、价格、数量等信息作为C4.5算法的样本集参数,按照算法计算出属性的信息熵
步骤2:计算分割后的类别的条件熵:将样本集分割成若干个属性,计算属性条件熵
步骤3:计算类别的信息熵:利用信息熵公式计算类别的信息熵
步骤4:判断所有属性是否计算完,已计算完转到步骤1,否则转步骤5
步骤5:计算信息增益率:信息增益率为属性的信息熵与类别信息熵之差
步骤6:按分裂属性值创建决策树 :在某一属性集合中将最大增益率的属性作为分列属性,将最大增益率的属性作为树双亲结点,其余的作为该结点的孩子
步骤7:剪枝判定:当决策树划分得太细,数据量很大时,需要设定一个规则,使算法及时收敛,避免算法无限分支无限增长,即剪枝,本发明采用前剪枝法结合树深度限定法对决策树进行剪枝
步骤8:判断是否构建完决策树,如果构建完成,则转步骤9,否则转步骤1
步骤9:输出决策分析结果:本发明采用后剪枝法对建立好的决策树进行剪枝,构建最优决策树,最优决策树即为决策分析结果。
2.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤1中计算属性的信息熵的具体计算过程如下:
设S为已知类标号的数据样本集,类标号属性为,定义了m个不同类的,设是S中类数据样本的集合,和分别表示S和的样本个数,则对的信息熵Info(S)定义如下:
其中, 是中任意数据样本属于类的概率,Info(S)的实际意义是类别S中数据样本分类的平均信息量。
3.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤2中计算分割后的类别的条件熵的具体计算过程如下:
若分类属性将S划分成个不同的子集表示数据样本集S中在上的取值为的所有样本组成的集合,选择S的一个属性A,则类别分割后的类别条件熵计算公式为:
。
4.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤3中计算类别的信息熵的具体计算过程如下:
若选择属性作为分裂属性,则类别信息熵为:
。
5.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤5中信息增益率的计算的具体计算过程如下:
信息增益率使用分裂信息值将信息增益规范化,属性的信息增益为
从信息增益的计算公式可以看出,的实际意义是基于属性分裂后,数据集所含信息量的有效减少量,信息增益越大,表明按属性对数据集分裂所需的期望信息越少,即属性解决的不确定信息量越大,分裂后的输出分区越纯,则信息增益率为
。
6.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤6中按分裂属性值创建决策树的具体计算过程如下:
决策树基于数据结构中树的概念,决策树C4.5的创建是通过将所有属性的信息增益率按大小排序,然后将各个属性作为分支的根节点的顺序
在某一属性集合中将最大增益率的属性作为分列属性,即,即将最大增益率的属性作为树双亲结点,其余的作为该结点的孩子。
7.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤7中剪枝判定的具体计算过程如下:
当决策树划分得太细,数据量很大时,需要设定一个规则,使算法及时收敛,避免算法无限分支无限增长,即剪枝,本发明采用前剪枝法结合树深度限定法对决策树进行剪枝,具体的实施如下:
前剪枝法:前剪枝法是指在构造树的过程中就知道哪些节点可以剪掉,于是干脆不对这些及诶点进行分裂,本发明通过计算增益率方差来确定是否对某一节点剪枝,增益率标准差大于某一设定值,则对该节点剪枝,否则可以分割建立其子树,数学公式描述为:
如果,则剪枝,否则继续分割生成决策子树
树深度限定法:设定一个确限定的树深度L,当决策树的深度到达L以后,停止分割。
8.根据权利要求1中所述的一种基于决策树算法的制造业材料采购分析方法,其特征是,以上所述步骤9中输出决策分析结果的具体计算过程如下:
创建了决策树后,可以清晰的看到各个属性的效果,但是要得到一个具体的方案,还需要进一步的分析才能得到确切的决策方案,本发明采用后剪枝法对建立好的决策树进行剪枝,最后留下最优决策树作为最终的决策树,后剪枝方法描述为:在建立好一棵决策树以后,通过一定的剪枝标准来考察该剪掉哪些子树,本发明对后剪枝标准设定为:通过计算价值函数值,来判定如何构建最优决策树,价值函数用信息增益来刻画,具体计算如下:
在决策树的第L层剪枝:
计算第L层节点的价值函数值:
选第L层节点中价值函数值最大的节点作为最优决策树第L层的右孩子,选该右孩子的兄弟节点中价值函数值最大的兄弟节点作为最优决策树第L层的左孩子,其余的第L层的节点剪掉
在决策树第2层到(L-1)层节点剪枝:
计算第l层的价值函数:
其中,为第l层节点的在第(l+1)层的还未被剪掉的孩子价值,明显地,如果没有留下来的孩子,则,同样的,选第l层节点中价值函数值最大的节点作为最优决策树第l层的右孩子,选该右孩子的兄弟节点中价值函数值最大的兄弟节点作为最优决策树第l层的左孩子,其余的第l层的节点剪掉,如此下去,最终会得到一棵最优决策树,最优决策树即为决策分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610438660.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理