[发明专利]基于大数据的配电网异常指标的识别与处理方法及装置有效

专利信息
申请号: 201810836346.3 申请日: 2018-07-26
公开(公告)号: CN109145957B 公开(公告)日: 2023-09-12
发明(设计)人: 陈蕾;阙波;盛晔;陈彤;郑贤舜;叶怡君;夏惠惠;叶清泉;郑圣;涂金金;李莉 申请(专利权)人: 国网浙江省电力有限公司温州供电公司;国网浙江省电力有限公司;国家电网有限公司
主分类号: G06F18/23213 分类号: G06F18/23213;G06Q50/06
代理公司: 杭州华鼎知识产权代理事务所(普通合伙) 33217 代理人: 项军
地址: 325000 *** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 配电网 异常 指标 识别 处理 方法 装置
【权利要求书】:

1.基于大数据的配电网异常指标的识别与处理方法,其特征在于,包括以下步骤:

步骤A:采集公变运行数据并发送至用电信息采集系统,并将公变运行数据存放在用电信息采集系统的HBase数据库中;

步骤B:将公变运行数据从HBase库中加载至分布式内存中;

步骤C:利用iForest算法识别出运行数据的异常值并将其删除;

步骤D:将经过步骤C剩余数据子集用k-means算法聚类;

步骤E:将步骤D聚类后用每个类别相应维度处的平均值填补删掉的异常值;

在步骤C中所述iForest算法识别运行数据异常值,具体为:

C1、对运行数据进行无放回随机抽样;

C2、根据样本数据构造iTree树,即随机选择一个维度,在该维度上随机选择一值作为划分点,将该维度里小于划分点的数据放在当前节点的左子叶,大于划分点的数据放在当前节点的右子叶;

C3、按步骤C2所述操作对子叶迭代,直到数据不可再分或树的高度达到阈值;

C4、按步骤C1、C2、C3所述的操作构建更多iTree树,组成iForest森林;

C5、将全部数据遍历所有iTree树,计算每个数据x在iTree上高度h(x),由n个iTree树的h(x)计算异常指数s(x,n),将异常指数超出阈值的数据点作为异常值识别出来;

步骤C5中h(x)为数据点x距离根节点的层数,异常指数s(x,n)由下式求得:

其中E(h(x))表示h(x)的均值,c(n)则由下式得到:

c(n)=2H(n-1)-(2(n-1)/n)

其中,H(i)为调和级数,H(i)=ln(i)+0.5772156649。

2.如权利要求1所述的基于大数据的配电网异常指标的识别与处理方法,其特征在于,步骤D中经过步骤C剩余数据子集用k-means算法聚类,具体为:

D1、在剩余数据中随机选择K个点作为初始质心,其中K为指定的参数;

D2、计算其余所有点与质心点的欧氏距离;

D3、将所有与质心点距离值小于阈值的点归为一个聚类簇;

D4、重新计算每个聚类簇的中心点位置并定义其为新的质心;

D5、迭代步骤D2和步骤D3,直到达到设定的迭代次数或质心点位置收敛;

D6、计算聚类的轮廓系数,修改K值,重复步骤D1至D5,选择轮廓系数最高的聚类模型作为最终模型。

3.如权利要求2所述的基于大数据的配电网异常指标的识别与处理方法,其特征在于,步骤D6中,聚类的轮廓系数S(i)由下式计算得到:

其中a(i)为样本i到同簇其它样本欧氏距离的均值,b(i)为样本i到其它簇所有样本欧氏距离的均值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司温州供电公司;国网浙江省电力有限公司;国家电网有限公司,未经国网浙江省电力有限公司温州供电公司;国网浙江省电力有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810836346.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top