[发明专利]一种基于气象模式识别的风电功率预测误差建模方法有效
申请号: | 201911309950.1 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111008504B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 柯德平;刘念璋;牛四清;杨健;刘健;柳玉;姜尚光 | 申请(专利权)人: | 武汉大学;国家电网公司华北分部 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06Q10/04;G06Q10/06;G06Q50/06;G06F111/10;G06F113/06 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 彭艳君 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 气象 模式识别 电功率 预测 误差 建模 方法 | ||
1.一种基于气象模式识别的风电功率预测误差建模方法,其特征是,包括通过对历史气象数据进行k-means聚类分析得到相应的气象模式;根据各气象模式下气象数据特征,训练支持向量机分类器;并用其将历史风电功率预测误差数据划分为各个气象模式下的子数据集,分别对子数据集进行统计分析得到对应的概率密度曲线;进而基于通用分布模型,通过最小二乘拟合得到各气象模式下风电功率预测误差概率密度模型,从而完成对风电功率预测误差的建模;
包括以下具体步骤:
步骤1、选取气象指标,对历史气象数据以及历史风电功率预测误差数据进行预处理;
步骤2、将历史气象数据根据月份划分为四个季度下的数据集,通过肘部法确定各季度下气象模式数目,并利用K-means算法对各季度下历史气象数据分别进行聚类分析,建立相应的气象模式;
步骤3、根据步骤2所建立气象模式,利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器;根据历史风电功率预测误差数据对应的气象数据,将风电功率预测误差划分为各个气象模式下的子集;
步骤4、根据步骤3计算所得各气象模式下风电功率预测误差数据子集,对各数据子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线;利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式,完成不同气象模式下的风电功率预测误差建模;
步骤1的实现包括以下步骤:
步骤1.1、选取风速、风向、气温和气压作为气象指标;
步骤1.2、对历史数据进行的预处理包括缺失值与异常值处理以及数据的标准化;具体步骤如下:
步骤1.2.1、采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除,实现缺失值与异常值处理;
步骤1.2.2、数据的标准化采用0-1标准化方法,通过对历史数据进行线性变换使其转换到[0,1]区间,转换所用公式如下:
其中u表示待转换的历史数据风速、风向、气温、气压、风电功率预测误差,u*表示0-1标准化后的历史数据,umax与umin分别为历史数据中的最大值与最小值;
步骤2的实现包括以下步骤:
步骤2.1、利用肘部法确定各季度下气象模式数目为:
其中,k为该季度下的气象模式数目,ωj表示第j个气象模式,nj为第j个气象模式的聚类中心,ei为属于第j个气象模式当中的第i个气象数据样本点,SSE为误差平方和,表示各气象模式内样本点与聚类中心的误差平方的和;
步骤2.2、利用k-means算法对各季度下历史气象数据分别进行聚类分析,形成各季度下的气象模式的具体步骤如下:
步骤2.2.1、从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
步骤2.2.2、分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
步骤2.2.3、重新计算k个类簇的均值,循环步骤2.2.2与步骤2.2.3,直到聚类中心不再发生变化为止;
步骤3的实现包括以下步骤:
步骤3.1、利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器的步骤:
步骤3.1.1、气象模式类别为2的支持向量机算法;
对于容量为L的气象数据训练样本集T={(xi,yi),i=1,2,…,L},若xi属于第一类,则记为yi=1;若xi属于第二类,则记为yi=-1;
选取高斯径向基核函数,将线性不可分的样本数据映射到高维特征空间中,变得可分,核函数形式为:
它将训练样本集映射到Hilbert空间,得到对应的新的气象数据训练集
选取惩罚因子C,控制外点规模和抑制噪声数据点,构造并求解最优问题;
s.t.yi((τ·xi)+b)≥1-ξi,ξi≥0,i=1,…,L
上式中τ是Hilbert空间中的分类面;ξ是松弛变量;C是惩罚参数;构造Lagrange函数,得到上述问题的对偶问题为:
得到最优解选取α*的一个正分量并据此计算阈值:
最终得到用于气象数据分类的最优分类函数为
步骤3.1.2、气象模式类别大于2的支持向量机算法;
采用逐一鉴别方法,构造k个SVM子分类器,在构造第j个SVM子分类器时,将属于第j类别的样本数据标记为正类,不属于j类别的样本数据标记为负类;训练时,对历史气象数据样本分别计算各个子分类器的判别函数值,并选取判别函数值最大所对应的类别为气象数据样本的类别,从而实现多分类;
步骤3.2、利用训练得到的支持向量机分类器,根据与历史风电功率预测误差数据对应的历史气象数据,判断出历史风电功率预测误差数据样本点所对应的气象模式,进而将历史风电功率预测误差数据进行分箱,变为各季度各气象模式的误差数据箱;
步骤4的实现包括以下步骤:
步骤4.1、利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线;各曲线为一组二维数据,即平面上的m个点(wp,vp),p=1,2,…,m,wp各不相同,令v=f(w),使得f(w)在最小二乘下与所有数据点最为接近,利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式;
令f(w)=a1r1(w)+a2r2(w)+…asrs(w),
式中,rz(w)为选定的一组线性无关的函数,az为待定系数,z=1,2,…,s,δp为vp与f(wp)的距离;v与w之间的函数关系为所选取的通用分布模型;
步骤4.2、确定待定系数az;
记
式中,J即为各点的距离平方之和;为求az使J达到最小,利用极值的必要条件z=1,…,s,得到关于a1,…,as的线性方程组,
即
记
A=[a1,…,am]T,V=[v1,…,vs]T
则方程组可表示为
RTRA=RTV
当{r1(w),…,rs(w)}线性无关时,R列满秩,RTR可逆,于是方程组有唯一解:
A=(RTR)-1RTV
所选取的通用分布函数形式已知,通用分布的概率密度表达式如下:
式中λ,β,γ即为决定通用分布模型形状的参数;
步骤4.3、利用最小二乘拟合,通过使拟合函数与概率密度曲线的距离平方和最小,求出与曲线最接近的通用分布模型中的未知参数,得到相应的通用分布模型,完成不同气象模式下风电功率预测误差的通用分布建模。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学;国家电网公司华北分部,未经武汉大学;国家电网公司华北分部许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911309950.1/1.html,转载请声明来源钻瓜专利网。