[发明专利]数据清洗方法、装置及服务器有效
申请号: | 201910046106.8 | 申请日: | 2019-01-17 |
公开(公告)号: | CN109783486B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 胡阳;奚芸华;潘晨阳 | 申请(专利权)人: | 华北电力大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 邓超 |
地址: | 102206*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 清洗 方法 装置 服务器 | ||
1.一种数据清洗方法,其特征在于,包括:
获取实测数据样本,其中,所述实测数据样本为风电场中风机的风速和功率的实测运行数据;
在Copula空间中建立所述风速和所述功率的联合概率分布,其中,所述联合概率分布的取值范围为[0,1]区间;
将所述联合概率分布的取值范围均匀划分成多个概率区间;
分别沿所述风速和所述功率所在的维度,在每个所述概率区间内对所述实测数据样本进行数据清洗;
其中,所述数据清洗的算法为四分位法;
所述分别沿所述风速和所述功率所在的维度,在每个所述概率区间内对所述实测数据样本进行数据清洗的步骤包括:
对于每一个所述概率区间,分别定义所述概率区间内的分位点Q1、Q2和Q3,其中Q2为中分位点;其中,基于所述分位点,所述四分位法的四分位距表示为:LIQ=Q3-Q1;
基于所述四分位距计算数据清洗的清洗区间,根据所述清洗区间在每个所述概率区间内对所述实测数据样本进行四分位法数据清洗;
所述清洗区间表示为:[Llow,Lupp]=[Q1-αLIQ,Q3+αLIQ];其中,所述Llow为有效数据下限、Lupp为有效数据上限;α为缩放系统;
所述根据所述清洗区间在每个所述概率区间内对所述实测数据样本进行四分位法数据清洗的步骤包括:
定义所述风速和所述功率在所述Copula空间维度u、v;
在每个空间维度上定义相应的划分间隔和缩放系数;
基于所述划分间隔和所述缩放系数在每个所述概率区间内执行四分位法数据清洗的过程。
2.根据权利要求1所述的方法,其特征在于,所述在Copula空间中建立所述风速和所述功率的联合概率分布的步骤包括:
采用核密度估计法分别建立风速数据和功率数据的边缘概率分布;
根据所述边缘概率分布建立所述风速和所述功率的经验Copula分布,以得到所述风速数据和所述功率数据在所述Copula空间的概率散点分布。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述Copula空间中,计算所述概率散点分布对应的评价系数,以对所述概率散点分布包括的多个概率散点的集中程度进行评价。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述划分间隔和所述缩放系数,将所述划分间隔和所述缩放系数标记为待优化参数;
按照预先设置的约减规则将所述待优化参数进行约减;以及,
设置迭代跳出条件,对约减后的所述待优化参数进行迭代优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910046106.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置