[发明专利]一种基于LOF算法的风电站原始风电数据质量控制的方法在审
申请号: | 202111668876.X | 申请日: | 2021-12-30 |
公开(公告)号: | CN114358176A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 冯杉;魏璐;孙睿藻;王丽;李伊吟;程凯琪 | 申请(专利权)人: | 河南省气象服务中心(河南省气象影视和宣传中心) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 郑州银河专利代理有限公司 41158 | 代理人: | 张佴栋 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lof 算法 电站 原始 数据 质量 控制 方法 | ||
1.一种基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,包括以下步骤:
步骤一、收集并整理风电站原始风电数据;
步骤二、利用滑动标准差方法识别出受仪器故障影响而出现的连续无变化或者变化很小数据,并将其剔除;
步骤三、剔除原始风电数据中缺测的数据;
步骤四、根据国家、行业相关标准文件以及风力发电机功率曲线对风速、实际有功功率数据进行数值范围检验,剔除超出合理范围的数据;
步骤五、利用归一化方法对数据进行缩放;
步骤六、在以上数据的预处理后,计算数据点的第k距离邻域、第k可达距离、局部可达密度以及局部离群因子LOF值;
步骤七、将LOF值高于设定阈值的数据点视作异常点,并将异常值剔除。
2.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤二中,对于无变化或者变化很小数据的剔除,采用5点滑动标准差方法进行识别,其计算公式如(1)所示:
其中n=5,识别点为x3,即识别点为5点的中心点;当数据连续无变化时,标准差为0;当数据变化很小时,标准差值也很小。
3.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤五中,计算公式如(2)所示:
其中x为数据原始值,x′为数据归一化之后的值,xmax和xmin都为样本数据的最大值和最小值。
4.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤六中,第k距离,定义dk(O)为点O的第k距离,dk(O)=d(O,P),满足如下条件:在集合中至少存在k个点P′∈D\{O},使得d(O,P′)≤d(O,P);在集合中至多存在k-1个点P′∈D\{O},使得d(O,P′)<d(O,P)。
5.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤六中,第k距离邻域,设Nk(O)为点O的第k距离邻域,满足:Nk(O)={P′∈D\{O}|d(O,P′)≤dk(O)}。
6.根据权利要求1的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤六中,第k可达距离,以O为中心,点P到点O的第k可达距离定义为:dk(P,O)=max{dk(o),d(O,P)}。
7.根据权利要求1的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤六中,局部可达密度,点P的局部可达密度表示为点P的第k邻域内点到P的平均可达距离的倒数,其计算公式如下:
8.根据权利要求1的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤六中,局部离群因子LOF值,点P的局部离群因子LOF表示为点P的邻域点Nk(P)的局部可达密度与点P的局部可达密度之比的平均数,其计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南省气象服务中心(河南省气象影视和宣传中心),未经河南省气象服务中心(河南省气象影视和宣传中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111668876.X/1.html,转载请声明来源钻瓜专利网。