[发明专利]数据清洗方法、装置及服务器有效

专利信息
申请号: 201910046106.8 申请日: 2019-01-17
公开(公告)号: CN109783486B 公开(公告)日: 2020-11-24
发明(设计)人: 胡阳;奚芸华;潘晨阳 申请(专利权)人: 华北电力大学
主分类号: G06F16/215 分类号: G06F16/215;G06K9/62
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 邓超
地址: 102206*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 清洗 方法 装置 服务器
【权利要求书】:

1.一种数据清洗方法,其特征在于,包括:

获取实测数据样本,其中,所述实测数据样本为风电场中风机的风速和功率的实测运行数据;

在Copula空间中建立所述风速和所述功率的联合概率分布,其中,所述联合概率分布的取值范围为[0,1]区间;

将所述联合概率分布的取值范围均匀划分成多个概率区间;

分别沿所述风速和所述功率所在的维度,在每个所述概率区间内对所述实测数据样本进行数据清洗;

其中,所述数据清洗的算法为四分位法;

所述分别沿所述风速和所述功率所在的维度,在每个所述概率区间内对所述实测数据样本进行数据清洗的步骤包括:

对于每一个所述概率区间,分别定义所述概率区间内的分位点Q1、Q2和Q3,其中Q2为中分位点;其中,基于所述分位点,所述四分位法的四分位距表示为:LIQ=Q3-Q1

基于所述四分位距计算数据清洗的清洗区间,根据所述清洗区间在每个所述概率区间内对所述实测数据样本进行四分位法数据清洗;

所述清洗区间表示为:[Llow,Lupp]=[Q1-αLIQ,Q3+αLIQ];其中,所述Llow为有效数据下限、Lupp为有效数据上限;α为缩放系统;

所述根据所述清洗区间在每个所述概率区间内对所述实测数据样本进行四分位法数据清洗的步骤包括:

定义所述风速和所述功率在所述Copula空间维度u、v;

在每个空间维度上定义相应的划分间隔和缩放系数;

基于所述划分间隔和所述缩放系数在每个所述概率区间内执行四分位法数据清洗的过程。

2.根据权利要求1所述的方法,其特征在于,所述在Copula空间中建立所述风速和所述功率的联合概率分布的步骤包括:

采用核密度估计法分别建立风速数据和功率数据的边缘概率分布;

根据所述边缘概率分布建立所述风速和所述功率的经验Copula分布,以得到所述风速数据和所述功率数据在所述Copula空间的概率散点分布。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

在所述Copula空间中,计算所述概率散点分布对应的评价系数,以对所述概率散点分布包括的多个概率散点的集中程度进行评价。

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取所述划分间隔和所述缩放系数,将所述划分间隔和所述缩放系数标记为待优化参数;

按照预先设置的约减规则将所述待优化参数进行约减;以及,

设置迭代跳出条件,对约减后的所述待优化参数进行迭代优化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910046106.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top