[发明专利]一种基于Netlogo与Matlab的负荷分布式控制方法有效
申请号: | 201510725409.4 | 申请日: | 2015-10-29 |
公开(公告)号: | CN106647249B | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 雍太有;李亚平;金珍;吴英俊;谢俊;岳东;毛文博;冯树海;王珂;刘建涛;曾丹;郭晓蕊;周竞 | 申请(专利权)人: | 中国电力科学研究院;国家电网公司;国网山东省电力公司电力科学研究院 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;G06Q10/04;G06Q50/06 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作策略 分布式控制 电价 电力系统仿真 数据交互接口 仿真过程 联合仿真 目标倾向 收敛状态 响应特性 最优策略 坐标形式 收敛性 总功率 总目标 代理 三维 直观 输出 概率 | ||
1.一种基于Netlogo与Matlab的负荷分布式控制方法,其特征在于,该控制方法基于强化学习算法,对每个负荷多智能体通用模块构造策略集,在策略集中选择对应总目标函数值最大的策略,包括如下步骤:
步骤1:建立基于Matlab与Netlogo的联合仿真平台及数据交互接口模块:Matlab用于电力系统的各项运算;Netlogo用于电力系统智能元件建模、负荷分布式控制和负荷代理的建立;
步骤2:分别根据负荷基准量、电价、经济性倾向度和舒适度倾向度,建立负荷-电价响应特性模型;
步骤3:根据所述负荷-电价响应特性模型,得到各个负荷的总目标函数;
步骤4:设定负荷各个目标倾向度大小在0-1之间,所有目标的目标倾向度构成的集合称为负荷动作策略集合;将0-1等距离离散化m份,每个目标的目标倾向度均有m个选择;
步骤5:定义并初始化负荷的每个策略的倾向系数和概率系数;按概率选择各负荷的动作策略,将动作策略以Netlogo中的坐标形式表示出来,各个负荷分别运动到Netlogo三维层面中相应的位置上,不同的位置对应不同的策略;
设定网络节点初始电价,根据对应的负荷-电价响应特性模型,获得此时各个负荷的功率,并且结合负荷代理针对对应负荷的管辖,分别获得各个负荷代理的总功率;
步骤6:将所述各个负荷代理的总功率通过Matlab与Netlogo之间的数据交换接口模块,由Netlogo发送至Matlab中,在Matlab中分别针对各个负荷代理的总功率进行市场出清,获得对应各个网络节点的电价从而更新Netlogo中每个负荷节点的电价,再由每个负荷代理将节点电价下发给其所管辖的负荷;
步骤7:每个负荷对所选的策略进行计算以获得各负荷策略的学习效用,按照修正参数修改所述动作策略集合中各策略的被选概率,即所述概率系数,在系数调配合适的情况下,系统达到收敛状态,即某个动作策略被选择的概率趋近于1,则满足了强化学习过程中的终止条件,在未满足终止条件情况下,循环执行步骤5、6、7;
所述步骤2中,所述负荷-电价响应特性模型是将电价信号与负荷自身目标融合考虑的负荷模型,如下式所示:
其中Qi为负荷需求量,Qi0为负荷基准量,由负荷代理对供电专营区内终端用户的负荷预测取得;μi为经济性倾向度,为舒适度倾向度,ρi为供电公司向终端用户售电的电价;
所述负荷自身目标包括经济性和舒适度;
所述步骤3中,所述总目标函数Ri由各个目标函数乘以其相对应的目标倾向度后叠加而得,如下式所示:
Bi为负荷利润,Ci为负荷舒适度。
2.根据权利要求1所述的控制方法,其特征在于,所述多智能体通用模块包括通信属性子模块、智能属性子模块和物理属性子模块;
所述通信属性子模块用于模拟电力系统元件之间的信息交换过程;
所述智能属性子模块用于描述电力系统元件制定决策的过程;
所述物理属性子模块用于定义电力系统元件的运行状态。
3.根据权利要求1所述的控制方法,其特征在于,所述步骤1中,所述负荷代理管辖对应负荷节点下的所有负荷,并用于其管辖的各个负荷节点和Matlab之间的信息传输;
所述数据交互接口模块用于Matlab与Netlogo之间的数据交换。
4.根据权利要求1所述的控制方法,其特征在于,所述步骤6中,所述负荷根据初始电价以及当前策略,由负荷-电价响应特性模型得到此时每个负荷的功率,从而获得电网中负荷节点的负荷需求量;
采用Matlab中的最优潮流计算工具,根据此时电网的负荷需求量,计算出每个节点的电价及每台发电机出力情况。
5.根据权利要求1所述的控制方法,其特征在于,对于每个动作,所述负荷i都标有所述倾向系数qi和所述概率系数pi,而在控制过程中的策略更新方法如下:
假设所述负荷i的可选的策略集合为:
若在重复博弈D轮后策略被选中,其中x∈[0,m],y∈[0,m],此时D轮更新倾向系数为qi(x,y)(D),D轮更新概率系数为pi(x,y)(D),负荷i此轮的目标值为profiti(x,y)(D);
则若在重复博弈D+1轮后策略被选中,其中x1∈[0,m],y1∈[0,m],此时D+1轮更新倾向系数为:
式中,为策略在D轮被选中时的更新倾向系数,r为遗忘因子,为策略在D轮被选中时的总目标函数:当x1≠x或y1≠y时,当x1=x且y1=y时,其中e为一个经验参数,对于负荷在重复博弈早期学习阶段生成各种不同的报价策略起到鼓励作用;
此时D+1轮更新概率系数为:
负荷i根据新的选择概率,按照轮盘赌方式选择下一轮的策略行为,对于每个行为动作,负荷都标志有倾向系数qi和概率系数pi,每轮策略都根据总目标值更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院;国家电网公司;国网山东省电力公司电力科学研究院,未经中国电力科学研究院;国家电网公司;国网山东省电力公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510725409.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双球头球扁钢组件及其焊接方法
- 下一篇:一种计算机散热气体过滤机箱