[发明专利]一种配变数据清洗修补方法及系统在审
申请号: | 201711145757.X | 申请日: | 2017-11-17 |
公开(公告)号: | CN109801181A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 郭屾;栾文鹏;王鹏;林佳颖 | 申请(专利权)人: | 中国电力科学研究院有限公司;国家电网公司;国网天津市电力公司 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06K9/62 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 修补 数据清洗 分类 配电网状态 高级应用 量测数据 数据缺失 需求管理 算法 分析 | ||
1.一种配变数据修补方法,其特征在于:
根据目标日中待修补数据的缺失程度,对待修补数据进行分类;
根据分类情况对所述待修补数据进行修补。
2.如权利要求1所述的配变数据修补方法,其特征在于:所述目标日中待修补数据为同一天中针对同一项数据所采集的不完整配变数据;所述不完整配变数据为连续缺失1~8点的配变数据。
3.如权利要求2所述的配变数据清洗修补方法,其特征在于:在根据目标日中待修补数据的缺失程度,对待修补数据进行分类之前,还包括:
剔除目标日待修补数据中的异常高数据和异常低数据;
所述异常高数据的判断条件为预设时间段内前后两次量测偏离范围高于预设最高阈值的数据;所述异常低数据为预设最低阈值。
4.如权利要求3所述的配变数据修补方法,其特征在于:所述预设时间段为15min,所述预设最低阈值为0。
5.如权利要求1-4任一所述的配变数据修补方法,其特征在于:所述根据目标日中待修补数据的缺失程度,对待修补数据进行分类,包括:
对于连续缺失2次及以下的待修补数据,采用均值插补法修补缺失数据;
对于连续缺失3~8次的待修补数据,通过计算历史日数据与目标日待修补数据的相关系数,并选择相关系数最大的历史日数据进行线性回归,以修补缺失数据。
6.如权利要求5所述的配变数据清洗修补方法,其特征在于,所述对于连续缺失2次及以下的数据,采用均值插补法修补缺失数据,包括:
在缺失数据前后各取m个有效数据,组成数据集合(ti,yi),i=1,2,...,2m;
在选定的函数中求拟合函数使缺失数据到拟合函数的误差平方和E2=∑(p(ti)-yi)2最小,则p(t)为数据集合(ti,yi)的最小二乘解;
通过数据集合(ti,yi)的最小二乘解p(t)求取目标日待修补数据缺失点ti所对应的修补值yi,所述yi为ti时刻对应的配变数据。
7.如权利要求5所述的配变数据清洗修补方法,其特征在于,所述对于连续缺失3~8次的待修补数据,通过计算历史日数据与目标日待修补数据的相关系数,并选择相关系数最大的历史日数据进行线性回归,以修补缺失数据,包括:
获取历史时段内所有历史日数据,并分别计算每个历史日数据与目标日待修补数据之间的相关系数;
选择与目标日待修补数据之间相关系数最大的历史日数据,通过最小二乘法进行线性回归,确定两组数据之间的特征描述公式;
从相关系数最大的历史日数据中选取与目标日待修补数据缺失点所对应的历史日数据,通过所述特征描述公式确定目标日待修补数据缺失点所对应的修补值。
8.如权利要求7所述的配变数据修补方法,其特征在于,通过下式计算每个历史日数据与目标日待修补数据之间的相关系数:
式中,X为历史日;Y为目标日;R(x,y)为第X日历史日数据和第Y日目标日数据之间的相关系数;j为第X日和第Y日配变数据均不存在缺失数据的数据位置,即j∈N,j≤96,且满足n为j的总数;Xj为历史日数据中第j点配变数据;Yj为目标数据线中第j点配变数据。
9.如权利要求7所述的配变数据修补方法,其特征在于,所述特征描述公式,如下式:
Yj=aXj+b (2)
其中,a、b分别为特征描述方程的斜率和截距;为第X日历史数据的平均数;为第Y日待修补数据的平均数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;国家电网公司;国网天津市电力公司,未经中国电力科学研究院有限公司;国家电网公司;国网天津市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711145757.X/1.html,转载请声明来源钻瓜专利网。