[发明专利]一种异常用电数据检测方法、系统、设备、存储介质在审
申请号: | 201910641996.7 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110503570A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 刘恬语;张涛;刘松梅;王桢干;刘伟;徐蕾 | 申请(专利权)人: | 国网江苏省电力有限公司滨海县供电分公司;滨海强源电气实业有限公司;国网江苏省电力有限公司盐城供电分公司;国网江苏省电力有限公司;国家电网有限公司 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06Q10/06;G06K9/62;G06F16/215;G06F16/25;G06F16/2458 |
代理公司: | 11369 北京远大卓悦知识产权代理事务所(普通合伙) | 代理人: | 韩飞<国际申请>=<国际公布>=<进入国 |
地址: | 224500 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线损管理 异常用电 数据检测系统 规范化管理 研究和分析 存储介质 电子设备 获取数据 模型建立 数据检测 数据降维 数据清洗 数据挖掘 台区用电 异常用户 综合管理 线损 节能 筛选 透明 应用 | ||
本发明提供一种异常用电数据检测方法,包括步骤:获取数据,数据清洗,数据降维,模型建立,筛选异常用户。本发明还涉及一种异常用电数据检测系统、电子设备和存储介质。本发明有效的解决了线损管理中存在的问题,能够针对台区用电系统的线损异常进行数据挖掘研究和分析,使线损管理更加透明、高效,能够发挥其综合管理应用,最终实现节能降损、规范化管理的目标。
技术领域
本发明涉及用电信息采集技术领域,尤其涉及一种异常用电数据检测方 法。
背景技术
随着信息化时代的迅速发展,率先展开大数据相关研究的是互联网、信 息通信行业。对电力行业而言,大数据也同样具有深远的研究意义和光明的 应用前景。随着下一代电力系统逐步演进,基于数据驱动的电力供应链将逐 步取代传统的电力供应链。其中用电信息采集系统的推广,为我国电力行业 开展基于电力数据分析的管理运营决策和供电服务优化提供了必要的数据基 础。同时随着电能数据、工况数据、事件信息等用电数据呈指数增长,大数 据特征越来越显著,用电大数据的应用需求日益迫切。海量的用电数据主要来源于各类计量装置及系统,由于多种设备故障、通信故障、电网波动和管 理等原因,出现了大量异常的用电数据。面对这种海量用电数据的增加,多 数电力部门仅使用传统的统计方法进行异常数据分析,并且大多需要依赖现 场检验来实现。由于受到人力、物力、财力的限制,异常数据背后隐藏的深 层次原因无法有效得以提炼,却带来了“数据灾难”和“数据荒废”。因此, 用传统分析手段己难以满足要求,我们需要通过数据挖掘来发现用电数据异常更深层次的规律,排除数据的偶然性,提炼数据的必然性。
由于低压客户群体数量庞大,且变化频繁,目前台区线损管理中普遍存 在户变关系不清、抄表质量不佳、窃电、计量故障等管理原因导致的线损异 常。近几年,国内许多供电企业不同程度的面临一个共同的窘境,即在治理 台区线损上“投资大、回报小”,其根源是近十年以来,影响台区线损的主要 因素已经转变为管理上的损耗,而改造投资方向不变。
发明内容
为了克服现有技术的不足,本发明提供一种异常用电数据检测方法。本 发明通过基于实时数据库与云计算、云实时存储平台技术相融合的应用一体 化,使用高效的并行计算技术实现大数据批处理任务的高吞吐率。采用稳定 性好,抗噪性能强的孤立森林算法有效挖掘数据异常用户,分析线损原因, 加强台区线损管理。
本发明提供一种异常用电数据检测方法,包括如下步骤:
获取数据,通过用电信息采集方式获取用电数据;
数据清洗,将采集到的用电数据进行清洗,并检测用电数据中脏数据的 类型,得到有效用电数据;所述脏数据的类型包括:缺失值、重复值、极大 极小值、负荷毛刺、冲击负值;
数据降维,利用日负荷特性指标对所述有效用电数据进行特征降维,所 述日负荷特征指标包括负荷率、峰谷差率、最高利用小时率、峰期负载率、 平期负载率、谷期负载率;
模型建立,若干个孤立树构建成孤立森林,利用孤立森林算法建立第一 分析模型,利用评估曲线进行模型评估;
筛选异常用户,利用所述第一分析模型对目标数据进行筛选,并对筛选 过的数据进行数据挖掘,筛选出用电异常用户。
优选地,所述用电信息采集方式包括云存储,所述云存储用于将所述用 电数据分散存储在多台独立的存储服务器上,所述存储服务器的类型包括元 数据管理服务、卷管理服务和块数据管理服务。
优选地,在步骤数据清洗中还包括:根据用电负荷的波动周期特性填充 空缺失值的计算公式如下:
其中,Xi表示当前时刻的用电负荷,i为负荷数据缺失的时刻,取值为 1-24,a1和a2为前后两天对应时刻和当前时刻前后两个时间点负荷的加权 系数。
优选地,在步骤获取数据之前还包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司滨海县供电分公司;滨海强源电气实业有限公司;国网江苏省电力有限公司盐城供电分公司;国网江苏省电力有限公司;国家电网有限公司,未经国网江苏省电力有限公司滨海县供电分公司;滨海强源电气实业有限公司;国网江苏省电力有限公司盐城供电分公司;国网江苏省电力有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910641996.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于区块链的新能源结算系统
- 下一篇:抽水蓄能电站抖动数据采集方法及系统