[发明专利]一种基于密度筛选与K-均值聚类的反窃电预警方法及系统在审
申请号: | 202010299704.9 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111797887A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 杨艺宁;薛阳;刘厦;杨恒;王聪;杨柳;徐英辉;林繁涛 | 申请(专利权)人: | 中国电力科学研究院有限公司;国家电网有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q50/06 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 姜丽楼 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密度 筛选 均值 反窃电 预警 方法 系统 | ||
1.一种基于密度筛选与K-均值聚类的反窃电预警方法,所述方法包括:
获取目标行业正常用户限定期间的用电数据作为训练样本;
将所述训练样本进行归一化处理,获取经过处理的训练样本;
基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数;
将所述初始聚类中心和所述聚类数作为K-均值聚类的初始值,基于所述K-均值聚类对经过处理的训练样本进行聚类,获取目标行业典型负荷曲线;
计算待检用户的负荷曲线与所述目标行业典型负荷曲线的负荷曲线的欧氏距离和余弦距离;
基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标;
当所述异常度指标大于预先设定的异常阈值时,将所述待检用户判断为窃电嫌疑用户。
2.根据权利要求1所述的方法,所述将所述训练样本进行归一化处理,获取经过处理的训练样本,包括:
所述训练样本为Pw'={Xwi'}(i=1,2,...,s),Xwi'是第w个行业第i个用户的数据,s为该行业提取的用户数;
对所述训练样本Pw'进行归一化处理,得到经过处理的训练样本Pw={Xwi}(i=1,2,...,s),归一化的公式为,
式中,Xwi为第i个用户归一化后的训练样本的数据,Xwi'max、Xwi'min分别为第i个用户的归一化前的训练样本的最大数据和最小数据。
3.根据权利要求2所述的方法,所述基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数,包括:
(1)计算训练样本空间Pw中任意两个训练样本点的欧氏距离d(Xwi,Xwj),
d(Xwi,Xwj)=||Xwi-Xwj||2 (2)
式中,Xwi、Xwj分别为第w个行业用户i、j的数据;
(2)计算训练样本空间Pw中所有样本点的平均距离Meandist,
(3)计算每个训练样本点的密度参数Density(Xwi,Meandist),并形成密度参数集合D;
上式中,所述密度参数表示的是以样本点Xwi为中心、平均距离Meandist为半径的范围内样本点的个数;
(4)找出所述密度参数集合D中的最大值Dmax,并统计Dmax的数量N;如果N=1,找出所述密度参数集合Dmax所对应的样本点的数据Xwi,将此处的数据Xwi添加到初始中心候选集U中,并转到步骤(6)执行下一步操作;
(5)若N1,则说明密度最值点不唯一,则计算多个密度最值点(Xwi,Meandist)邻域内其余样本点与该最值点的距离之和sum,
将计算所得的距离之和sum最小的密度最值点的数据Xwi添加到初始中心候选集U中;
(6)将最值样本点的数据Xwi及(Xwi,Meandist)邻域内的样本点都删去;
(7)重复步骤(3)至步骤(6),直到找出所有的初始候选中心。
4.根据权利要求3所述的方法,还包括:将初始中心候选集U的数据作为K-均值聚类的初始聚类中心和K值,基于所述K-均值聚类对训练样本空间Pw进行聚类,得到聚类结果Cw={Xwi,i=1,2,...,k},Xwi表示第w个行业的第i个类中心的数据,k为聚类类数;以所述聚类结果Cw作为目标行业的典型负荷曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;国家电网有限公司,未经中国电力科学研究院有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010299704.9/1.html,转载请声明来源钻瓜专利网。