[发明专利]基于大数据分析的用电异常检测方法在审
申请号: | 201910990554.3 | 申请日: | 2019-10-18 |
公开(公告)号: | CN111177208A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 姚长征;张自强;李玉杰;王选岐;曹少荣;王蔚;延亮;李红兵 | 申请(专利权)人: | 姚长征 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F16/27;G06F16/28;G06F16/29;G06Q50/06 |
代理公司: | 安徽力澜律师事务所 34127 | 代理人: | 沈国庆;张志宏 |
地址: | 745000 甘肃省庆*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 分析 用电 异常 检测 方法 | ||
1.基于大数据分析的用电异常检测方法,其特征在于,包括以下步骤:
S1、掌握不同类型居民的用电规律,通过实现对用电类别、地域类型9类居民用户的电量特征刻画,掌握居民用电规律;
S2、识别异常用电居民,提升营销用电精益化管理水平,从海量居民用电数据中准确定位离群用户,预警电价执行差错、异常用电等风险客户清单,
S3、通过问题管理堵塞跑冒滴漏产生的经济价值,针对异常用电客户,协同业务部门核实处理,同时保证居民与供电商的利益,堵塞跑冒滴漏产生的经济价值。
2.根据权利要求1所述的基于大数据分析的用电异常检测方法,其特征在于,所述步骤S1中,前期用Oracle进行存储,后期备选大数据平台的Hive进行数据存储,利用宽表关联ID获取所取数据;
使用Pycharm、Anaconda等相关集成工具环境进行数据的模型构建;
融合用户档案信息、电能表信息、用户表计日冻结电量信息、外部气象等多源数据:一是数据准备及数据处理;
二是通过数据分布、趋势分析等途径探索数据规律,为后续建模提供依据;
三是基于K-Shape聚类算法分类开展居民用电特征画像;
四是基于孤立森林算法分类构建离群识别模型,识别离群用户。
3.根据权利要求1所述的基于大数据分析的用电异常检测方法,其特征在于,所述步骤S2中,内部数据主要包含居民用电客户档案和日冻结电量;
用电客户档案来自于营销系统,日冻结电量来自于用采系统,均为一次数据,数据可信度较高;
用电客户档案字段完整,不存在缺失情况,日冻结电量因采集原因不存在重复情况,而存在少量数据项缺失情况,整体字段完整度较高,不影响后续的数据挖掘分析;
用电客户档案存在整体记录重复的情况,用户地址录入不规范影响到GIS地理分布离群客户识别;日冻结电量主要存在数据为空或电量数值突变的情况可通。
4.根据权利要求1所述的基于大数据分析的用电异常检测方法,其特征在于,所述步骤S2中,对存在重复情况的数据,只保留第一条,其余删除;对核心字段缺失的情况,删除整条数据;对电量数据为空或数值幅度突变的情况,使用该数据临近数据平移填补;
日冻结电量宽表中,统计各条数据的缺失情况;根据具体缺失情况和防止填补缺失值过多影响分析结果的情况出现,确定对数据缺失维度超过55维的数据删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于姚长征,未经姚长征许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910990554.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置