[发明专利]一种基于决策树算法识别用电类别的方法及系统在审
申请号: | 201911410254.X | 申请日: | 2019-12-31 |
公开(公告)号: | CN111222556A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 金昌铉;王淼;程俊春;朱宇龙;马博;赵永国;刘森;黎晚晴;张君;梁惠欣 | 申请(专利权)人: | 中国南方电网有限责任公司;南方电网数字电网研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06F16/215 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 算法 识别 用电 类别 方法 系统 | ||
1.一种基于决策树算法识别用电类别的方法,其特征在于,所述方法包括以下步骤:
S100:读取电力数据集;
S200:对电力数据集进行预处理和清洗;
S300:将电力数据集划分为训练数据集和测试数据集;
S400:根据训练数据集建立决策树;
S500:对决策树进行剪枝处理得到用电性质识别模型;
S600:通过用电性质识别模型输出决策树中各节点的目标字段分布取值、每个分支的概率、数值字段的取值、节点编号、节点字段索引。
2.根据权利要求1所述的一种基于决策树算法识别用电类别的方法,其特征在于,在S200中,对电力数据集进行预处理和清洗的方法为:预处理为通过对电力数据集进行分类或分组前所做的审核、筛选、排序等必要的处理,即数据审核完整性和准确性、数据筛选、数据排序,即数据清理、数据集成、数据变换、数据归约;利用数理统计、数据挖掘或预定义的清理规则将脏数据转化为满足数据质量要求的数据,即清洗后的电力数据集。
3.根据权利要求1所述的一种基于决策树算法识别用电类别的方法,其特征在于,在S300中,将电力数据集划分为训练数据集和测试数据集的方法包括:留出法、交叉验证法、自助法任意一种方法。
4.根据权利要求1所述的一种基于决策树算法识别用电类别的方法,其特征在于,在S400中,根据训练数据集建立决策树的方法为:
S410:依次选择训练数据集中的用电类别属性作为节点,对用电类别属性的每种可能的取值创建一个分枝,并据此将训练数据集划分为几个子集;
S420:对每个分枝采取相同的方法,训练数据集是其父节点划分的若干子集中的对应于分枝取值的那个样本子集;
S430:当以出现下情况出现时停止节点分枝的分裂,并使其成为叶子节点:
情况1:给定节点的训练数据集中的所有电力数据属于同一类;
情况2:没有剩余属性能够用来划分训练数据集;
S440:给定节点的记录数小于叶子节点支持的最少记录数,则直接将给定节点设置为叶子节点,其值设置为大于1的整数。
5.根据权利要求1所述的一种基于决策树算法识别用电类别的方法,其特征在于,在S400中,还要对决策树的参数进行调优,调优的方法包括以下步骤:
T410:令种群规模NS=20;代数t=0;
T420:随机生成种群规模NS的个体组成初始种群,其中种群中的每个个体存储了决策树的剪枝簇数C和置信边界为g;
T430:逐个计算种群中所有个体的适应值,并选出最优个体gBXt;
T440:从种群中随机选择出一个个体执行全局搜索,搜索方法为:
其中为全局搜索得到的新个体,IXt和RXt为从种群中随机选择出来的两个不相等的个体,LS为搜索系数,sr为[0,1]之间的随机实数,MAXT为最大演化代数,exp为指数函数,log为对数函数;
T450:计算的适应值;如果的适应值小于RXt的适应值,则在种群中用替换RXt,否则保持RXt不变;
T460:保存最优个体gBXt,然后设置当前代数t=t+1;
T470:如果代数大于20则转到T430,代数小于等于20转到步骤T480;
T480:将种群中的最优个体调整为决策树的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司;南方电网数字电网研究院有限公司,未经中国南方电网有限责任公司;南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911410254.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种系统数据安全管控系统
- 下一篇:信号处理装置、方法及电子设备