[发明专利]一种适用于太阳能光伏数据的数据清洗方法在审
申请号: | 201910156191.3 | 申请日: | 2019-03-01 |
公开(公告)号: | CN109918365A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 江冰;肖心园;胡钢 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常数据 太阳能光伏 错误数据 清洗 缺省数据 冗余数据 数据清洗 数据重构 光伏 重构 采集 关联性数据 数据变化率 应用统计学 多组数据 清洗效果 三次样条 三个步骤 数据误差 相邻区域 正常数据 组传感器 挖掘 插值法 传感器 最大化 补齐 单组 删除 | ||
1.一种适用于太阳能光伏数据的数据清洗方法,其特征在于,包括以下步骤:
S1,采集光伏数据,在相邻区域设置多组传感器采集太阳能光伏数据,得到多组强关联性数据,将不同组传感器在同一时间采集的数据在数据库中按列进行排序,将同一组传感器在不同时间采集的数据在数据库中按行进行排序;
S2,挖掘所述光伏数据中的异常数据,并将所述异常数据分为三类数据,分别为:冗余数据、缺省数据和错误数据;
S3,清洗异常数据,首先,删除异常数据中的冗余数据;然后,对单组传感器测得的错误数据采用SPGP数据重构法进行数据重构;最后,对数据库中整行错误数据和缺省数据采用基于三次样条插值法的数据重构法进行数据重构。
2.根据权利要求1所述的一种适用于太阳能光伏数据的数据清洗方法,其特征在于,步骤S1中,所述传感器包括光照度传感器、光功率传感器,所述光伏数据包括光照强度、光功率。
3.根据权利要求1所述的一种适用于太阳能光伏数据的数据清洗方法,其特征在于,步骤S2中,所述异常数据的分类依据为:
冗余数据:判断多组传感器采集光伏数据的时间值是否一致,时间值不一致的光伏数据即为冗余数据;
缺省数据:计算多组数据的平均测量时间间隔t,判断每行数据的测量时间与相邻行数据的测量时间的差值是否超过2t,若超过2t,则该行数据为缺省数据;
错误数据:分别计算各组数据随时间的变化率,判断每列数据的变化率是否大于前列数据变化率的1.25倍,若是,则进一步判断该列数据是否超出正常数据范围,若两个判断条件均满足,则该列数据为错误数据。
4.根据权利要求3所述的一种适用于太阳能光伏数据的数据清洗方法,其特征在于,所述正常数据范围的定义为:
μ-2σ≤x≤μ+2σ
其中,x为正常数据,μ为所有数据的平均值,σ为所有数据的标准差。
5.根据权利要求1所述的一种适用于太阳能光伏数据的数据清洗方法,其特征在于,步骤S3中,对单组传感器测得的错误数据采用SPGP数据重构法进行数据重构的方法为:
令X,Y分别为两组传感器测同一物理量得到的不同数据值序列,X序列中只有一个错误数据,设该错误数据值为变量x;Y序列中所有数据均为正常数据值;当X、Y两组数据的关联性最强时,错误数据x=x0,x0即为错误数据x的重构数据;计算X、Y两组数据的皮尔逊相关系数ρX,Y,即
公式(1)对x求偏导,代入X、Y中的正常光伏数据,令偏导值为0,有
联立公式(1)、(2)解出重构数据值x0;即,当x=x0时,X、Y两组数据的关联性最强,x0即为错误数据x重构后的数据值。
6.根据权利要求1所述的一种适用于太阳能光伏数据的数据清洗方法,其特征在于,步骤S3中,所述基于三次样条插值法的数据重构法具体为:
提取所有数据中表现正常的N个数据值作为f(x),将所述N个数据对应的时间序列设为区间x=[x0,xN];将区间x划分为N个等步长的子区间;设在每个子区间j=(0,1,...,N-1)内均满足三次多项式Sj(x),有
Sj(x)=aj0+aj1x+aj2x2+aj3x3,
j=0,1,...,N-1 (3)
令S(xj)=f(xj),j=(0,1,...,N) (4)
为保证各子区间的曲线合并为大区间时节点处光滑,令
S(xj-0)=S(xj+0),j=(0,1,...,N) (5)
S'(xj-0)=S'(xj+0),j=(1,2,...,N-1) (6)
S”(xj-0)=S”(xj+0),j=(1,2,...,N-1) (7)
令S(xj)=f(xj)=yj (8)
hj=xj-xj-1 (9)
S″(xj)=Mjj=(0,1,...,N) (10)
根据拉格朗日插值公式,有
根据公式(3)~(11),可得
令
则公式(11)可表示为
αjMj-1+2Mj+βjMj+1=cjj=(1,2,…,N-1) (13)
根据光伏数据的正态分布特性,数据两端的曲线处于水平状态,有Sj(x)满足第一类边界条件,有
S'(x1)=S'(xN)=0 (14)
联立公式(13)、(14)得到关于Mj的N+1阶线性方程组,其矩阵形式为三对角线方程组,即
代入所有表现正常的光伏数据到公式(15)中,采用追赶法解出Mj,从而得到各子区间的三次多项式;再将检测到的单组错误数据代入该错误数据对应子区间的三次多项式,得到该错误数据重构后的数据值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910156191.3/1.html,转载请声明来源钻瓜专利网。