[发明专利]一种基于离群点算法的窃电辨识方法有效
申请号: | 201811161728.7 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109947815B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 丁学峰;钦伟勋;张旭;卢峰;蔡慧;赵羚;李跃华;韩蕾;李熊 | 申请(专利权)人: | 国网浙江长兴县供电有限公司;国网浙江省电力有限公司;中国计量大学;浙江华云信息科技有限公司;国家电网有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06Q50/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 313100 浙江省湖*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 离群 算法 辨识 方法 | ||
1.一种基于离群点算法的窃电辨识方法,其特征在于包括以下步骤:
1)获取用户日用电数据;
采用用电信息采集和远程抄表系统对若干个用电用户的用电数据进行采集,通过数据传输通道和数据接收系统,将数据存储于中心数据库,作为该方法进行防窃电辨识报警的数据来源;
每一天的日用电量是根据用户抄表系统采集的该天表计总正向有功减去前一天的表计总正向有功而得到;
2)对数据进行预处理;
采用线性函数法,即其中,x(k)代表任意一个样本值,min(x(n))代表样本极小值,max(x(n))代表样本极大值;将y(k)化为介于0和1之间的数,消除样本受量纲和属性的影响,将数量级大的数据转化成可以相互进行数学运算的具有可比性的数据,降低数据处理的复杂度;
3)计算样本波动率CV;
根据数据样本按照每月分别计算波动率,从波动率值CV0.2的月份中找到最小的样本波动率CVm,并初步确定窃电可能发生的时间段;
4)确定质心以及参数p和D;
采用求两次均值的方法:第一次计算所有数据的均值,即其中,d1、d2、dn代表每天的用电量,n为样本总数;第二次求均值是除去异常偏高值后计算剩余样本的均值,即排除若干个异常偏高值后,剩余m个样本求均值,以avg2为总样本质心,计算所有样本与该质心的距离集合Dist,设置自定义条件确定参数p;D为对Dist集合进行升序排列后,求出的新的集合的p分位数;
4)离群点算法进行窃电判别;
计算两两样本之间的欧氏距离,在调节参数p并计算参数D后,找到与其它至少p部分样本距离大于D的所有样本点,确定为离群点;
5)确定窃电样本点和设置窃电警报;
在上述的离群点集合,将高于样本平均水平的离群点去除;当连续N天出现异常后,第N天进行窃电报警。
2.根据权利要求1所述的一种基于离群点算法的窃电辨识方法,其特征在于:若样本波动率CV大于0.6则进行聚类算法进行窃电判别;根据聚类算法得到的窃电判别结果计算窃电疑似度;窃电疑似度高于设定阈值并持续N2天,则报警并归档处理。
3.根据权利要求1所述的一种基于离群点算法的窃电辨识方法,其特征在于:在步骤3)计算样本波动率CV时,定义标准差和均值的比值作为样本波动率CV,即式中,di为用户单日电量,为日电量平均值,N为累计天数,σ为标准差,μ为均值;由公式可知,CV是单位均值上的离散程度,CV越大,反映样本偏离度越大,即电量波动程度越大;其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响;样本均值本身也反映了样本所代表的整体水平,因此用标准差和均值共同定义的指标CV可以准确地描述用电量数据的波动情况。
4.根据权利要求2所述的一种基于离群点算法的窃电辨识方法,其特征在于:对于聚类算法,在计算样本的波动率以后,当样本波动率在0.6以上时,选择聚类算法将样本分成3类,考虑到样本分正常和异常两种,在聚类以后,根据聚类中心将样本从高到低分为标签1类、2类、3类;若标签2类的聚类中心更靠近标签1类,则只取标签3类样本作为窃电嫌疑类;若标签2类的聚类中心更靠近标签3类,则取标签2类和3类作为窃电嫌疑类进行报警处理;
对于离群点算法,当样本波动率在0.6以下时择离群点算法直接筛选出异常点,设置合适的离群点参数p,在得到窃电异常数据后,设置报警条件进行报警。
5.根据权利要求1所述的一种基于离群点算法的窃电辨识方法,其特征在于:根据设置窃电报警条件后的算法结果,根据离群点算法参数p以及窃电报警天数设置f,计算离群点算法窃电疑似度为Q1=p×f1,其中,参数p代表了离群点的可信度,f代表了窃电可能性随着报警天数的增加而增大,用两者的乘积可以在一定程度表示根据算法得到的用户窃电嫌疑程度。
6.根据权利要求4所述的一种基于离群点算法的窃电辨识方法,其特征在于:进行聚类算法判别及疑似度计算时,根据聚类算法得到的报警时间设置参数f2,计算窃电嫌疑类占样本总体的比例系数j,最终计算窃电疑似度Q2=j×f2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江长兴县供电有限公司;国网浙江省电力有限公司;中国计量大学;浙江华云信息科技有限公司;国家电网有限公司,未经国网浙江长兴县供电有限公司;国网浙江省电力有限公司;中国计量大学;浙江华云信息科技有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811161728.7/1.html,转载请声明来源钻瓜专利网。