[发明专利]一种基于形态聚类和LightGBM的工业用户短期负荷预测方法有效
申请号: | 201910047094.0 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109766950B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 张化光;盛鸿翔;杨东升;周博文;杨珺;刘鑫蕊;孙振奥 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06Q10/04;G06Q50/06 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 刘晓岚 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 形态 lightgbm 工业 用户 短期 负荷 预测 方法 | ||
1.一种基于形态聚类和LightGBM的工业用户短期负荷预测方法,其特征在于:包括以下步骤:
步骤1、对采集到的工业用户负荷数据利用工业用户形态聚类算法(Industrial UserMorphological Clustering,即IUMC)进行形态聚类,具体方法为:
步骤1.1、数据预处理;针对工业用户负荷数据进行数据预处理,剔除缺失值大于数据总长度十分之一的用户,其他用户的缺失值采用相邻日插值填充,采用箱型图分析方法识别异常值,利用相邻日插值替换异常值;
步骤1.2、识别并分离大负荷企业;将单一企业日均负荷大于所有企业日均负荷γ倍的企业识别为大负荷企业,将大负荷企业数据分离,剩余企业识别为小负荷企业;
步骤1.3、合并弱相关性小负荷企业;计算小负荷企业负荷数据的皮尔逊相关系数,设弱相关性阈值为δ1,用户中与其他所有用户的相关系数最大值小于δ1的用户被识别为弱相关性企业,将弱相关性企业负荷按时间节点作和处理作为一个用户特殊处理;
步骤1.4、确定初始形态聚类中心;
步骤1.4.1、计算去除大负荷企业、弱相关性小负荷企业后数据的相关系数,选取相关系数最大值所对应的两个企业作为第一类,筛选与第一类两个企业相关系数均大于0.9的企业加入第一类,计算第一类企业负荷均值作为该类初始形态聚类中心;
步骤1.4.2、选取删除上一类企业相关系数后的各企业相关系数中最大值所对应的两个企业作为新一类,筛选与新一类两个企业相关系数均大于0.9的企业加入新一类,计算新一类企业负荷均值作为该类初始形态聚类中心;
步骤1.4.3、循环步骤1.4.2直至类数达到设定的Kmax,然后将分离出的单家大负荷企业用户、弱相关性小企业合并后的用户均单独作为一类加入数据和形态聚类中心中,如大负荷企业用户数为N,则此时类数和初始形态聚类中心数为(Kmax+N+1);
步骤1.5、完善用户形态聚类,遍历含有大负荷企业用户和弱相关性小负荷企业合并后用户的所有负荷数据,计算各企业与各形态聚类中心的相关系数,选取企业与各形态聚类中心相关系数最大值所对应的形态聚类中心,然后将该企业加入该形态聚类中心,重新计算各类的负荷数据均值作为新的形态聚类中心;
步骤1.6、完善形态聚类中心,计算各形态聚类中心相关系数,设类间相关性阈值为δ2,将类间相关系数大于δ2的类别合并为一类,新类的形态聚类中心为合并后类内各企业的负荷均值,若类间相关系数均小于δ2,则不作处理直接执行步骤1.8;
步骤1.7、重复执行步骤1.6直至各形态聚类中心相关系数均小于δ2;
步骤1.8、重复过程步骤1.5-步骤1.7直至形态聚类中心不再改变;
步骤1.9、计算形态聚类有效性,选出最佳形态聚类数;形态聚类有效性指标公式通过类内相关性公式除以类间相关性公式得到,类内相关性公式为类间相关性公式为聚类有效性指标公式为其中,xi为第m类的第i家用户,cm为第m类的形态聚类中心,nk为第m类的用户数,cij为形态聚类中心i与j之间的相关系数,k为总类数;
步骤2、根据形态聚类后各类别用户的负荷特性进行特征工程处理;
步骤3、将经过形态聚类和对应特征工程处理后的各类负荷数据利用其对应的LightGBM模型进行训练以及预测;
步骤4、将形态聚类后各类用户的LightGBM模型预测结果进行模型融合,得到电力系统工业用户短期负荷的最终预测结果。
2.根据权利要求1所述的一种基于形态聚类和LightGBM的工业用户短期负荷预测方法,其特征在于:所述步骤2的具体方法为:
步骤2.1、根据与电力系统历史负荷相对应的日期、天气、节假日数据构建其初步特征;
步骤2.2、构建各类用户特征线性相关性的热力图,热力图中线性相关性大于0.9的特征组只保留方差最大的特征,其余特征删除;
步骤2.3、利用互信息法计算各类数据的负荷变量和特征变量的相关性,删除相关性小于0.2的特征;
步骤2.4、利用LightGBM模型自带的特征重要性打分算法实现各类用户特征重要性的分析,保留重要特征,删除重要性得分小于0.5的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910047094.0/1.html,转载请声明来源钻瓜专利网。