[发明专利]一种基于LOF算法的风电站原始风电数据质量控制的方法在审
申请号: | 202111668876.X | 申请日: | 2021-12-30 |
公开(公告)号: | CN114358176A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 冯杉;魏璐;孙睿藻;王丽;李伊吟;程凯琪 | 申请(专利权)人: | 河南省气象服务中心(河南省气象影视和宣传中心) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 郑州银河专利代理有限公司 41158 | 代理人: | 张佴栋 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lof 算法 电站 原始 数据 质量 控制 方法 | ||
本发明提供一种基于LOF算法的风电站原始风电数据质量控制的方法,属于数据处理技术领域,包括以下步骤:一、收集风电站原始风电数据;二、利用滑动标准差方法识别出受仪器故障影响而出现的连续无变化或者变化很小数据,将其剔除;三、剔除原始风电数据中缺测的数据;四、根据标准文件对风速、实际有功功率数据进行数值范围检验,剔除超出合理范围的数据;五、利用归一化方法对数据进行缩放;六、在以上数据的预处理后,计算数据点的第k距离邻域、第k可达距离、局部可达密度以及局部离群因子LOF值;七、将LOF值高于设定阈值的数据点视作异常点,并将异常值剔除。本发明使用数据本身的属性来检测和分类原始数据,操作容易、方便。
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于LOF算法的风电站原始风电数据质量控制的方法。
背景技术
近年来,风能已成为一种主要的能源。以实测风速和功率为基础建立的风电功率曲线可以用于评价风电机组的性能和运行状态。然而,用于风数据采集和传输的传感器常常位于偏远的站点,暴露在开放、不受控制甚至恶劣的环境中,出现错误数据的概率相对较高。目前,风电机组运行数据的收集、管理、分析和挖掘还存在许多不足,采集到的数据比较粗糙,数据质量无法保证。
由于风速和风向的变化,风电具有波动性、间歇性和随机性等特点,因此数据挖掘的方法相比于传统的统计方法更适合于分析高度非线性的风电数据。
本文提出一种基于LOF算法的风电站原始风电数据质量控制的方法,以解决上述现有存在的问题。
发明内容
有鉴于此,本发明提供一种基于LOF算法的风电站原始风电数据质量控制的方法,提高数据质量控制准确率。
为解决上述技术问题,本发明提供一种基于LOF算法的风电站原始风电数据质量控制的方法,包括以下步骤:
步骤一、收集并整理风电站原始风电数据;
步骤二、利用滑动标准差方法识别出受仪器故障影响而出现的连续无变化或者变化很小数据,并将其剔除;
步骤三、剔除原始风电数据中缺测的数据;
步骤四、根据国家、行业相关标准文件以及风力发电机功率曲线对风速、实际有功功率数据进行数值范围检验,剔除超出合理范围的数据;
步骤五、利用归一化方法对数据进行缩放;
步骤六、在以上数据的预处理后,计算数据点的第k距离邻域、第k可达距离、局部可达密度以及局部离群因子LOF值;
步骤七、将LOF值高于设定阈值的数据点视作异常点,并将异常值剔除。
进一步的,所述步骤二中,对于无变化或者变化很小数据的剔除,采用5点滑动标准差方法进行识别,其计算公式如(1)所示:
其中n=5,识别点为x3,即识别点为5点的中心点;当数据连续无变化时,标准差为0;当数据变化很小时,标准差值也很小。
进一步的,所述步骤五中,计算公式如(2)所示:
其中x为数据原始值,x′为数据归一化之后的值,xmax和xmin都为样本数据的最大值和最小值。
进一步的,所述步骤六中,第k距离,定义dk(O)为点O的第k距离,dk(O)=d(O,P),满足如下条件:在集合中至少存在k个点P′∈D\{O},使得d(O,P′)≤d(O,P);在集合中至多存在k-1个点P′∈D\{O},使得d(O,P′)<d(O,P)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南省气象服务中心(河南省气象影视和宣传中心),未经河南省气象服务中心(河南省气象影视和宣传中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111668876.X/2.html,转载请声明来源钻瓜专利网。