[发明专利]一种用电时序数据的清洗方法在审
申请号: | 202110070591.X | 申请日: | 2021-01-19 |
公开(公告)号: | CN112732694A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 吴裔 | 申请(专利权)人: | 国网上海市电力公司;华东电力试验研究院有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/2458;G06Q50/06 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200122 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用电 时序 数据 清洗 方法 | ||
本发明涉及一种用电时序数据的清洗方法,包括以下步骤:S1:获取用电时序数据,按设定规律将用电时序数据分割为多个切片;S2:将各切片按照是否含有缺失值分为第一切片和第二切片,所述的第一切片为含有缺失值的切片,所述的第二切片为不含缺失值的切片;S3:对第二切片组成的集合构建索引;S4:利用索引,在第二切片组成的集合中查询与各第一切片对应的第二切片;S5:利用查询得到的第二切片,基于清洗模型,分别对各对应的第一切片进行数据清洗,填补其中的缺失值,与现有技术相比,本发明具有实用且通用性高等优点。
技术领域
本发明涉及电力信息大数据领域,尤其是涉及一种用电时序数据的清洗方法。
背景技术
电力电子装置的大规模接入使得电力企业能够在用户侧和电网侧采集海量数据。特别地,随着计量基础设施的迭代更新,电力数据的频度、精度和准度均提升显著。另一方面,运行、量测、通信等一、二、三次电力设备的故障事件普遍存在并影响数据质量。在此背景下,研发高效数据清洗工具,是电力企业开展智能分析工作的重要环节。
时间序列是在时间维度上对观测对象等间隔采样所形成的结构化数据。在电力系统中,基于负荷、电量等用电时序数据的智能分析工具已在各类业务场景中取得应用成效,这离不开高效数据清洗工具的辅助。发明专利申请CN201911226611.7提出了一种基于时间序列相似性的数据清洗方法及装置,该技术方案对用电时序数据依次执行降维、离散化和相似性度量等操作来计算待清洗时序数据的参考时序数据,并将待清洗时序数据中的缺失值/异常值替换为参考时序数据中相同位置的值;发明专利申请C201710790445.8提出了一种用于电力传感数据的清洗方法、装置和系统,该技术方案采用K-Means聚类方法将电力传感器采集的数据分为多个分区,检出每个分区中的异常值,采用平均值、中值或模式值对异常值进行替换。
包括上述在内的现有技术方案多采用相似性度量方法计算与待清洗时序数据相似的参考时序数据,并将参考时序数据中的值作为待清洗时序数据中同位置缺失值/异常值的修正值。目前,常用的相似性度量方法主要包括平滑法和模型法,前者一般计算历史数据的均值并将其作为邻近的缺失值/异常值的修正值,后者一般提取历史数据的波动特征来建立线性/非线性方程并将缺失值/异常值的上下文带入方程来计算修正值。前述方法的主要不足是:平滑法的使用条件是时间序列稳定,而负荷、电量等时序数据深受气象、节假日等周期性因素影响;模型法充分考虑周期性因素对时序数据的影响,但是模型能力依赖于训练样本的质量和数量;这使得基于平滑法和模型法的时序数据清洗效果未必满足基于用电量时序数据的智能分析的需求。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种实用性好且通用性强的用电时序数据的清洗方法。
本发明的目的可以通过以下技术方案来实现:
一种用电时序数据的清洗方法,包括以下步骤:
S1:获取用电时序数据,按设定规律将用电时序数据分割为多个切片;
S2:将各切片按照是否含有缺失值分为第一切片和第二切片,所述的第一切片为含有缺失值的切片,所述的第二切片为不含缺失值的切片;
S3:对第二切片组成的集合构建索引;
S4:利用索引,在第二切片组成的集合中查询与各第一切片对应的第二切片;
S5:利用查询得到的第二切片,基于清洗模型,分别对各对应的第一切片进行数据清洗,填补其中的缺失值。
进一步地,所述的步骤S1具体包括:
S11:获取用电时序数据集合,识别其中每条用电时序数据的异常值,并将异常值替换为缺失值;
S12:按设定规律将用电时序数据集合中的各用电时序数据分割为多个切片。
进一步地,所述的步骤S3具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;华东电力试验研究院有限公司,未经国网上海市电力公司;华东电力试验研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110070591.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置