[发明专利]一种基于均值漂移和XGBoost的异常用电判别方法在审
申请号: | 201911252147.9 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111160401A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 孙峰;王刚;程绪可;李家珏;温鑫;张冠锋;曾辉;白雪;张潇桐;赵清松;董鹤楠;李平 | 申请(专利权)人: | 国网辽宁省电力有限公司电力科学研究院;国家电网有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 辽宁沈阳国兴知识产权代理有限公司 21100 | 代理人: | 何学军;侯景明 |
地址: | 110006 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 均值 漂移 xgboost 异常 用电 判别 方法 | ||
1.一种基于均值漂移和XGBoost的异常用电判别方法,其特征是:包括以下步骤:
步骤1:采集台区用户的日冻结用电量信息,通过行列转置将日期转置为列标,定义公式Pij(i=1,2,…,k;j=1,2,…,n)表示用户i在第j天的用电量;
步骤2:基于用电量信息及用电量归一化后的用电波动性进行均值漂移聚类分析;
步骤3:对步骤2得到的均值漂移聚类结果差别进行标识,并对聚类分析结果取交集,形成初始疑似异常用电列表;
步骤4:从已经确认的异常用电名单中选取80%作为样本进行训练学习,形成基于用电数据的决策树模型;用决策树模型对剩余20%的异常用电名单的数据进行验证,并不断优化调整决策树模型;
步骤5:利用步骤4中得到的决策树模型对步骤3中的疑似异常用电列表进行二次筛选,得到最终的异常用电名单。
2.根据权利要求1所述的种基于均值漂移和XGBoost的异常用电判别方法,其特征是:所述用电量归一化方法指面向所有数据统一的归一化处理,表示如下:
其中:Pij表示第i个用户第j个日期的用电量。
3.根据权利要求1所述的种基于均值漂移和XGBoost的异常用电判别方法,其特征是:所述均值漂移聚类分析的方法步骤如下:
步骤2.1:选取随机中心点C;
步骤2.2:计算其他数据点与中心点C的欧氏距离小于半径H的集合M;
步骤2.3:计算从中心点开始到集合M中每个元素的向量,将这些向量相加,得到偏移向量;
步骤2.4:将该中心点沿着偏移的方向移动,移动距离就是该偏移向量的模;中心点偏移方法,表示如下:
xt+1=Mt+xt
其中,Mt为t状态下求得的偏移均值;xt为t状态下的中心;
步骤2.5:迭代步骤2.2~2.4,得到偏移向量的大小满足偏移量阈值的中心点;
步骤2.6:迭代步骤2.1~2.5,对各点进行归类。
4.根据权利要求1所述的种基于均值漂移和XGBoost的异常用电判别方法,其特征是:所述偏移向量计算方程,表示如下:
其中,Sh:表示以x为中心点,半径为h的高维球区域;k:表示包含在Sh范围内点的个数;xi:表示包含在Sh范围内的点。
5.根据权利要求1所述的种基于均值漂移和XGBoost的异常用电判别方法,其特征是:步骤3中所述均值漂移聚类结果进行标识与交集的方法,表示如下:
取用电量聚类结果中心曲线中除去数量最少的,以及居民用户占比在5%以下或95%以上的类别集合C1;以及用电波动性最大的聚类类别C2,取C1∩C2。
6.根据权利要求1所述的种基于均值漂移和XGBoost的异常用电判别方法,其特征是:步骤4中所述基于用电数据的决策树模型建立步骤如下:
步骤4.1:对异常用电名单中选取的80%样本进行行列转置,缺失补0;
步骤4.2:设置num_class为2,利用XGBoost算法建模;
步骤4.3:模型验证,参数调整。
7.根据权利要求1所述的一种基于均值漂移和XGBoost的异常用电判别方法,其特征是:步骤4中所述决策树模型,其目标函数表示如下:
其中i表示第i个样本,表示第i个样本的预测误差,l表示预测误差,k表示建立了k个回归树,fk表示回归树的复杂度的函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网辽宁省电力有限公司电力科学研究院;国家电网有限公司,未经国网辽宁省电力有限公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911252147.9/1.html,转载请声明来源钻瓜专利网。