[发明专利]基于C4.5决策树算法的电力业务协同分类方法及系统在审
申请号: | 201910860593.1 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110796331A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 司为国;朱炯;张博;张玉鹏;赵开;郭小茜;张浩;俞成彪;严志毅;闫宇铎;曹杰人;金仁云;宋惠忠;李骏;柳志军;唐鸣;张益军;施萌;张俊;侯伟宏;钟晓红;何可人;高瑾;吴颖;陈晨;厉律阳;徐国锋;章晨璐;朱小炜;孙远;向新宇;华玫;沈志强;朱坚;孙建军;仲从杰;毛无穷;刘磊 | 申请(专利权)人: | 国网浙江省电力有限公司杭州供电公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06 |
代理公司: | 33217 杭州华鼎知识产权代理事务所(普通合伙) | 代理人: | 黄利群 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务协同 决策树 信息增益 根节点 信息熵 样本集 指标集 决策树算法 方案评估 分类规则 节点生成 数据分类 数据计算 协同管理 有效实现 中间节点 分类 准确率 构建 算法 数据库 协同 评估 应用 分析 | ||
1.基于C4.5决策树算法的电力业务协同分类方法,其特征在于,包括如下步骤:
步骤101,获取电力业务协同相关数据库,并从中提取样本集S;
步骤102,提取指标集A,所述指标集A含有用于评估业务协同数据的指标;
步骤103,基于C4.5算法对样本集S计算各个指标的信息熵和信息增益比,以选定合适的根节点和中间节点;
步骤104,根据选定的根节点构建决策树;
步骤105,基于决策树对各个业务协同方案评估并进行选择。
2.根据权利要求1所述的基于C4.5决策树算法的电力业务协同分类方法,其特征在于,所述步骤103具体包括:
步骤1031,基于C4.5算法对样本集S计算各个指标的信息熵和信息增益比;
步骤1032,使用步骤1031得到的信息熵和信息增益比测试计算除训练数据集S以外的其他数据;
步骤1033,比较后选定合适的根节点和中间节点。
3.根据权利要求2所述的基于C4.5决策树算法的电力系统业务协同分类系统,其特征在于,所述基于C4.5算法对样本集S计算各个指标的信息熵和信息增益比的过程如下:
选取指标集A中的一个指标C,指标C具有m个可能的取值C={C1,C2,…,Cm},训练集S中Ci出现的频率为pi,其中1≤i≤m,m、i均为整数,则该训练集S的信息熵为:
再选取另一指标B作为根节点,用指标B将样本集S划分成样本子集Sj(j=1,2,…,k),则按指标B划分S的信息增益比为:
其中,按指标B划分S后的样本子集的信息熵为:
其中|Sj|为样本子集Sj中包含的样本数,|S|为样本集S中包含的样本数,1≤j≤k,k、j均为整数。
4.根据权利要求1所述的基于C4.5决策树算法的电力业务协同分类方法,其特征在于,所述步骤101和步骤102之间还包括如下步骤:
步骤111,判断样本集S中的所有样本数据是否为同一类,若是则转至步骤112,若否则执行步骤102;
步骤112,选择所有样本数据所属的类为根节点,并转至步骤104。
5.根据权利要求1所述的基于C4.5决策树算法的电力业务协同分类方法,其特征在于,所述步骤102和步骤103之间还包括如下步骤:
步骤121,判断样本集S以及指标集A是否为空,若是则转至步骤123,若否则执行步骤103;
步骤123,选择样本集S中占比最多的类为根节点,跳转至步骤104。
6.根据权利要求5所述的基于C4.5决策树算法的电力业务协同分类方法,其特征在于,所述步骤121和步骤103之间还包括如下步骤:
步骤122,判断指标集A中所有指标的值是否唯一,若是则转至步骤123,若否则执行步骤103。
7.根据权利要求2所述的基于C4.5决策树算法的电力业务协同分类方法,其特征在于,所述步骤1032和步骤1033之间还包括如下步骤:
步骤10321,判断是否有错误分类,若是则返回步骤1031,若否则执行步骤1033。
8.根据权利要求1至7任意一项所述的基于C4.5决策树算法的电力业务协同分类方法,其特征在于,所述步骤103和步骤104之间,还可包括如下步骤:
步骤131,判断所有指标是否已遍历,若否则转到步骤1032,若是则执行步骤104;
步骤132,剔除已遍历指标,生成无已遍历指标的样本子集S,跳转到步骤101。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司杭州供电公司,未经国网浙江省电力有限公司杭州供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860593.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理