[发明专利]一种用电时序数据的清洗方法在审
申请号: | 202110070591.X | 申请日: | 2021-01-19 |
公开(公告)号: | CN112732694A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 吴裔 | 申请(专利权)人: | 国网上海市电力公司;华东电力试验研究院有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/2458;G06Q50/06 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200122 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用电 时序 数据 清洗 方法 | ||
1.一种用电时序数据的清洗方法,其特征在于,包括以下步骤:
S1:获取用电时序数据,按设定规律将用电时序数据分割为多个切片;
S2:将各切片按照是否含有缺失值分为第一切片和第二切片,所述的第一切片为含有缺失值的切片,所述的第二切片为不含缺失值的切片;
S3:对第二切片组成的集合构建索引;
S4:利用索引,在第二切片组成的集合中查询与各第一切片对应的第二切片;
S5:利用查询得到的第二切片,基于清洗模型,分别对各对应的第一切片进行数据清洗,填补其中的缺失值。
2.根据权利要求1所述的一种用电时序数据的清洗方法,其特征在于,所述的步骤S1具体包括:
S11:获取用电时序数据集合,识别其中每条用电时序数据的异常值,并将异常值替换为缺失值;
S12:按设定规律将用电时序数据集合中的各用电时序数据分割为多个切片。
3.根据权利要求1所述的一种用电时序数据的清洗方法,其特征在于,所述的步骤S3具体包括:
S31:构建样本库V和待清洗库W;
S32:将第二切片放入样本库V,并将符合设定要求的第一切片放入待清洗库W;
S33:对样本库V中的第二切片执行符号化处理;
S34:对符号化处理后样本库V中的第二切片构建全文索引。
4.根据权利要求1所述的一种用电时序数据的清洗方法,其特征在于,所述的步骤S4中,与各第一切片对应的第二切片具体为:与第一切片相似度最高的K个切片,其中,K为大于零的整数。
5.根据权利要求3所述的一种用电时序数据的清洗方法,其特征在于,所述的按设定规律将用电时序数据分割为多个切片具体为:
从左向右依次将用电时序数据分割为多个等长的片段,所述的样本库V和待清洗库W中每个样本数据的长度相等,且等于各切片的长度。
6.根据权利要求3所述的一种用电时序数据的清洗方法,其特征在于,所述的步骤S32中,符合设定要求的第一切片具体为:
切片中缺失值的比例不大于第一设定阈值C1,且缺失区间长度不大于第二设定阈值C2。
7.根据权利要求4所述的一种用电时序数据的清洗方法,其特征在于,两个切片之间的相似度通过欧式距离确定。
8.根据权利要求3所述的一种用电时序数据的清洗方法,其特征在于,所述的符号化处理具体为:将第二切片从浮点数集合映射至整数集合。
9.根据权利要求1所述的一种用电时序数据的清洗方法,其特征在于,所述的用电时序数据包括总用电量数据、峰时用电量数据、平时用电量数据、尖时用电量数据和谷时用电量数据,各用电时序数据分别形成总用电量数据集U1、峰时用电量数据集U2、平时用电量数据集U3、尖时用电量数据U4和谷时用电量数据集U5。
10.根据权利要求9所述的一种用电时序数据的清洗方法,其特征在于,在步骤S1之前,还执行以下操作:若总用电量数据集U1、峰时用电量数据集U2、平时用电量数据集U3、尖时用电量数据U4和谷时用电量数据集U5中,同一位置的五个数据中仅有一个缺失值,则根据用电量的加和约束关系:总用电量数据=峰时用电量数据+平时用电量数据+尖时用电量数据+谷时用电量数据,进行缺失值修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;华东电力试验研究院有限公司,未经国网上海市电力公司;华东电力试验研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110070591.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置