[发明专利]利用AP聚类-跳转持续改进MC的风电出力模拟生成方法有效

专利信息
申请号: 202110710544.7 申请日: 2021-06-25
公开(公告)号: CN113449471B 公开(公告)日: 2022-08-30
发明(设计)人: 肖白;李梦雪;董凌;杨森林;苟晓侃;王学斌;王茂春;杨洪志 申请(专利权)人: 东北电力大学;国网青海省电力公司
主分类号: G06F30/27 分类号: G06F30/27;G06F17/18;G06K9/62;G06Q50/06;G06F111/08;G06F111/10;G06F113/06
代理公司: 吉林市达利专利事务所 22102 代理人: 陈传林
地址: 132012 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 ap 聚类 跳转 持续 改进 mc 出力 模拟 生成 方法
【权利要求书】:

1.一种利用AP聚类-跳转持续改进MC的风电出力模拟生成方法,其特征是,它包括:对历史风电出力数据进行AP聚类、形成某一聚类类别下风电出力状态跳转序列、形成某一聚类类别下时间序列长度为一天的风电出力状态时间序列、在某一聚类类别下形成的初步风电出力时间序列上抽样并叠加风电出力波动量、根据类间转移概率矩阵模拟生成风电出力时间序列,具体内容为:

1)对历史风电出力数据进行AP聚类

近邻传播(Affinity Propagation,AP)聚类算法是一种基于“信息传递”的无监督聚类算法;首先建立样本集合的相似度矩阵S为式(1),矩阵中的元素Sa,b表示样本xa与xb之间的相似度,采用负欧氏距离表示,为式(2);Sa,a为聚类中心的参考度,作为能否成为聚类中心的评判标准,在初始时均设置为偏向参数,其直接影响最终聚类的个数,偏向系数的值越大,产生聚类个数越多;对单位时间段内既定采样间隔的实测历史风电出力,以其日均值和日最值差来构造能够反映对应各日风电出力特征的向量,并利用该向量对历史风电出力以天为单位进行AP聚类,其中:单位时间段一般是指月、季、年、多年;采样间隔通常是指1分钟、5分钟或10分钟;

Sa,b=-||xa-xb||2 (2)

式中:S为样本集合的相似度矩阵;Sa,b表示样本xa与xb之间的相似度;Sa,a为聚类中心的参考度;xa和xb为数据样本点;a=1,2,……,n;b=1,2,……,n;n为用于AP聚类的样本总数;||xa-xb||2表示xa与xb间的欧氏距离;

将样本集合的相似度矩阵S作为输入,然后计算每个样本点的吸引度r(xa,xk)与归属度a(xa,xk);r(xa,xk)表示xk点是否适合作为xa点的聚类中心,即xk对xa的吸引度;a(xa,xk)表示xa点是否选择xk作为其聚类中心,即xa对xk的归属度;r(xa,xk)和a(xa,xk)越大,表明xk越适合作为聚类中心;聚类过程中不断地更新吸引度矩阵和归属度矩阵,为避免迭代过程中发生震荡,引入阻尼系数,直到迭代产生稳定的聚类中心和类别归属情况;因此,近邻传播结束时,xa的聚类中心确定为xk;其中,xk为式(3):

xk=argmax{a(xa,xk)+r(xa,xk)} (3)

式中:argmax为求取函数值最大的自变量,即xk为满足{a(xa,xk)+r(xa,xk)}取得最大值时的取值;a(xa,xk)为样本点xa对样本点xk的归属度;r(xa,xk)为样本点xk对样本点xa的吸引度;xk和xa为数据样本点;k=1,2,……,n;a=1,2,……,n;n为用于AP聚类的样本总数;

采用轮廓系数(Silhouette Coefficient,SC)作为聚类评价指标;轮廓系数越大表示聚类效果越好;轮廓系数SC(xk)定义为式(4)-(6):

式中:xk,xa,xb为数据样本点;C(xk)表示样本点xk所属的聚类类别;C(xa)表示样本点xa所属的聚类类别;C(xb)表示样本点xb所属的聚类类别;轮廓系数SC(xk)的值介于[-1,1],反映了xk作为聚类中心时,聚类中心与类内样本的平均距离I(xk)是否显著区别于它到类外样本的平均距离O(xk);I(xk)表示聚类中心与类内样本的平均距离;D(xk,xa)表示样本点xk与xa之间的距离;M表示与样本点xk同属同一类别的数据点个数;O(xk)表示聚类中心与类外样本的平均距离;D(xk,xb)表示样本点xk与xb之间的距离;G表示与样本点xk不属于同一类别的数据点个数;

通过对历史风电出力数据以天为单位进行AP聚类,可以将出力水平与波动特性相似的日风电出力序列划归为同一类;

2)形成某一聚类类别下风电出力状态跳转序列

将历史风电出力数据按照(P′min,P′max)均匀划分成N个数据段,每个数据段对应一个状态,则每个状态所对应的风电出力范围大小为(P′max-P′min)/N;其中,P′min为历史风电出力的最小值,P′max为历史风电出力的最大值,N为状态数;针对传统马尔科夫链存在风电出力序列容易陷入某种状态而难以跳转,以致生成的风电出力时间序列可能出现在某一状态下持续时间过长的情况,通过采用状态跳转矩阵代替状态转移矩阵进行改进;

在由聚类重构序列产生状态转移矩阵时,当相邻两个数据之间的状态数跳变幅度大于所划分状态数的1/3时,认为这一转移不符合实际,将此处的状态转移矩阵值置零,进而得到改进的状态转移矩阵;

其次,将上述得到的状态转移矩阵对角线元素全部置零,并计算每个元素占该行所有元素之和的比例,将其作为新的概率值,所得到的概率矩阵即为状态跳转矩阵;状态跳转矩阵为式(7)-(8);

pij=P(Et+1=j|Et=i) (8)

式中:矩阵P为状态跳转矩阵;矩阵P的行对应风电出力当前的出力状态,列对应下一时刻的出力状态;N为状态数;i,j为风电出力状态;i=1,2,……,N;j=1,2,……,N;pij代表风电出力从状态i转移到状态j的概率;Et、Et+1为第t时刻和第t+1时刻风电出力值对应的状态;P(A|B)为条件概率函数,表示在B的条件下出现A的概率;

相应的累积状态跳转矩阵为式(9):

Q中元素的取值为式(10):

式中:矩阵Q为累积状态跳转矩阵;qul为累积状态跳转矩阵Q中第u行、第l列的元素;puj为状态跳转矩阵P中第u行、第j列的元素;N为状态数;u=1,2,……,N;l=1,2,……,N;j=1,2,……,N;

通过上述累积状态跳转矩阵Q的形成过程,得到某一聚类类别下的累积状态跳转矩阵,即类内累积状态跳转矩阵;然后,根据类内累积状态跳转矩阵,抽样形成每一聚类类别下的状态跳转序列;在该聚类类别下,风电出力当前时刻的状态为Et,下一时刻的状态为Et+1,生成服从均匀分布的随机数ξ,若0ξ≤qEt,1,则Et+1=1;若qEt,lξ≤qEt,l+1,则Et+1=l+1,其中,qEt,1表示类内累积状态跳转矩阵Q的第Et行、第1列的元素;qEt,l表示类内累积状态跳转矩阵Q的第Et行、第l列的元素;qEt,l+1表示类内累积状态跳转矩阵Q的第Et行、第l+1列的元素;

由于状态跳转矩阵的对角线元素为零,相应的类内累积状态跳转矩阵中对角线元素与其左边元素相等,即qi,i-1等于qii,所以[qi,i-1,qii]为空集,在利用马尔科夫链法生成风电出力状态序列时,ξ不会落在[qi,i-1,qii]范围内;其中,qii为类内累积状态跳转矩阵Q中第i行、第i列的元素,i=1,2,……,N;qi,i-1为累积状态跳转矩阵Q中第i行、第i-1列的元素;

通过上述步骤,可以依据某一聚类类别下的类内累积状态跳转矩阵,抽样形成风电出力处在该聚类类别下时,相邻状态不相同的状态跳转序列;

3)形成某一聚类类别下时间序列长度为一天的风电出力状态时间序列

按照从风电出力进入到某个状态的第一个时刻开始记录,若其持续的时间为T,则记录该状态持续时间T一次的统计方法遍历历史风电出力时间序列,统计出风电出力在该状态下各个持续时间出现的次数,得到在该状态下持续时间的分布情况;

统计并绘制得到风电出力某一状态持续时间分布直方图后,采用一条平滑的曲线描述此直方图,能够避免对直方图抽样时存在的特殊性;在描述数据分布特性时,核密度估计(Kernel Density Estimation,KDE)不依赖于参数估计模型的选择,而且能够有效地避免直方图估计对于直方图组距和位置的依赖,所以采用KDE来描述风电出力状态持续时间分布特性;KDE表达式为式(11):

式中:为风电出力状态持续时间的核密度估计函数;K(·)为核函数;h为带宽;x1,x2,……,xW表示风电出力序列在某一状态下各个持续时间值的一组数据,数据数目为W个;xw为风电出力状态持续时间的第w个样本值,w=1,2,……,W;W表示风电出力序列在某一状态下出现了W个不同的持续时间;

在KDE中,带宽的选取决定了拟合曲线的平滑程度,带宽越大越平滑,但其拟合效果越差;选择高斯函数作为核函数,采用经验法则求取带宽,如式(12):

h=1.06σW-1/5 (12)

式中:h为带宽;σ为风电出力状态持续时间正态分布标准差;W表示风电出力序列在某一状态下出现了W个不同的持续时间;

为得到某一聚类类别下时间序列长度为一天的风电出力的状态时间序列,在生成满足核密度估计函数的各状态持续时间的随机数集合后,遍历得到的该聚类类别下的风电出力状态跳转序列,并进行重复抽样:当前状态为Et,则在状态Et的持续时间随机数集合中任意抽取一个数值,作为状态Et的持续时间,重复进行,直至生成的时间序列长度满足要求;

4)在某一聚类类别下形成的初步风电出力时间序列上抽样并叠加风电出力波动量

在形成某一聚类类别下的风电出力状态时间序列后,确定每一时刻的初步风电出力;风电出力当前时刻的状态为Et,则可以随机生成该时刻的初步风电出力P′t·cb的数值,P′t·cb∈(PEt.min,PEt.max),PEt.min、PEt.max分别为状态Et对应的风电出力范围的最小值与最大值;

风电出力波动性是指相邻时刻的出力值存在差异,采用一阶差分波动量,即相邻2个单位时间内的出力差值来刻画波动特性;风电出力的一阶差分波动量表达式为式(13):

ΔP′t=P′t+1-P′t (13)

式中:t表示风电出力时刻;ΔP′t表示t时刻风电出力波动量;P′t和P′t+1分别表示t时刻和t+1时刻的风电出力值;

风电出力一阶差分波动量的概率密度分布拟合函数有:正态分布、t-location-scale分布、logistic分布;使用拟合精度更好的混合高斯分布刻画风电出力波动特性,其概率密度函数是若干个高斯概率密度函数的加权,当数据分布复杂时,混合高斯分布函数能够解决单高斯分布函数拟合精度的不足,其数学模型表达式为式(14)-(15):

式中:f(x)为混合高斯分布函数;v=1,2,……,V;V为混合高斯分布中单高斯分布的个数;av为混合系数;pgs(x|bv,cv)为第v个单高斯分布的概率密度函数,其中,x表示服从单高斯分布的随机数;bv和cv分别代表第v个单高斯分布的均值和标准差;

采用最大期望(expectation-maximization,EM)算法求解混合高斯分布函数对应分布参数,EM算法分为两步:第1步称为期望(E)步,它基于初始值的参数或之前的迭代值来计算似然函数的期望;第2步是最大化(M)步,它将似然函数最大化,并转换为可获得的新参数值,EM算法是反复迭代的过程,直到上述两个步骤收敛;

在生成满足混合高斯分布函数的波动量随机数集合后,随机抽取波动量,并在形成的初步风电出力值上叠加波动量,如式(16);遍历生成的初步风电出力时间序列,叠加波动分量完成,形成某一聚类类别下时间序列长度为一天的风电出力时间序列;

P′t·fd=P′t·cb+ΔP′t (16)

式中:P′t·fd为某一聚类类别下风电出力时间序列t时刻的风电出力值;P′t·cb为某一聚类类别下风电出力时间序列t时刻初步风电出力值;ΔP′t表示t时刻风电出力波动量;

5)根据类间转移概率矩阵模拟生成风电出力时间序列

根据含风力发电的电力系统中长期优化调度的需要,确定模拟生成风电出力时间序列的时间长度,而中长期优化调度所需的时间长度一般为2天及以上;

分别统计相邻两天风电出力所属类别之间的转移次数,并计算相对应的转移概率得到类间转移概率矩阵,如式(17)-(18),进而可以得到累积类间转移概率矩阵,如式(19)-(20);

plj·rz=P(He+1=z|He=r) (18)

式中:矩阵Plj为类间转移概率矩阵;矩阵Plj的行对应当日风电出力所属的聚类类别,列对应次日风电出力所属的聚类类别;L为AP聚类所产生的类别数量;r,z为风电出力所属的聚类类别;r=1,2,……,L;z=1,2,……,L;plj·rz代表风电出力所属的聚类类别由类别r转移到类别z的概率;He、He+1为当日和次日风电出力所属的聚类类别;P(A|B)为条件概率函数,表示在B的条件下出现A的概率;

式中:矩阵Qlj为累积类间转移概率矩阵;qlj·rg为累积类间转移概率矩阵Qlj中第r行、第g列的元素;plj·rz为类间转移概率矩阵Plj中第r行、第z列的元素;L为AP聚类所产生的类别数量;r=1,2,……,L;z=1,2,……,L;g=1,2,……,L;

由当日风电出力所属的聚类类别,依据累积类间转移概率矩阵,抽样得到次日风电出力所属的AP聚类类别:当日风电出力所属的聚类类别为He,次日风电出力所属的聚类类别为He+1,生成服从均匀分布的随机数ε,若0ε≤qHe,1,则He+1=1;若qHe,gε≤qHe,g+1,则He+1=g+1,其中,qHe,1表示累积类间转移概率矩阵Qlj的第He行、第1列的元素;qHe,g表示累积类间转移概率矩阵Qlj的第He行、第g列的元素;qHe,g+1表示累积类间转移概率矩阵Qlj的第He行、第g+1列的元素;

模拟生成既定采样间隔下,R天内的风电出力时间序列的步骤如下,R为正整数:

①判断第1天风电出力所属的AP聚类类别;

②通过执行步骤2)-4),形成第1天的风电出力模拟生成时间序列,记为Ω1,Ω1={P′1·fd(1),P′2·fd(1),……,P′t·fd(1)},其中,Ω1表示第1天的风电出力模拟生成序列;其中,P′t·fd(1)表示第1天第t个时刻的模拟生成风电出力值,t表示风电出力时刻;

③由步骤5)计算得到风电出力累积类间转移概率矩阵,抽样确定第τ天风电出力所属的AP聚类类别,τ=2,3,……,R;

④重复步骤2)-4),得到第τ天的风电出力模拟生成时间序列,记为Ωτ,Ωτ={P′1·fd(τ),P′2·fd(τ),……,P′t·fd(τ)},其中,Ωτ表示第τ天的风电出力模拟生成序列;P′t·fd(τ)其中表示第τ天第t个时刻的模拟生成风电出力值;

⑤重复执行③-④,直至生成共R天的风电出力时间序列,记为Ω,Ω={Ω1,……,Ωτ,……,ΩR}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北电力大学;国网青海省电力公司,未经东北电力大学;国网青海省电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110710544.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top