[发明专利]一种基于Netlogo与Matlab的负荷分布式控制方法有效

申请号：	201510725409.4	申请日：	2015-10-29
公开（公告）号：	CN106647249B	公开（公告）日：	2019-11-01
发明（设计）人：	雍太有;李亚平;金珍;吴英俊;谢俊;岳东;毛文博;冯树海;王珂;刘建涛;曾丹;郭晓蕊;周竞	申请（专利权）人：	中国电力科学研究院;国家电网公司;国网山东省电力公司电力科学研究院
主分类号：	G05B13/04	分类号：	G05B13/04;G06Q10/04;G06Q50/06
代理公司：	北京安博达知识产权代理有限公司 11271	代理人：	徐国文
地址：	100192 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	动作策略分布式控制电价电力系统仿真数据交互接口仿真过程联合仿真目标倾向收敛状态响应特性最优策略坐标形式收敛性总功率总目标代理三维直观输出概率
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于Netlogo与Matlab的负荷分布式控制方法，其特征在于，该控制方法基于强化学习算法，对每个负荷多智能体通用模块构造策略集，在策略集中选择对应总目标函数值最大的策略，包括如下步骤：

步骤1：建立基于Matlab与Netlogo的联合仿真平台及数据交互接口模块：Matlab用于电力系统的各项运算；Netlogo用于电力系统智能元件建模、负荷分布式控制和负荷代理的建立；

步骤2：分别根据负荷基准量、电价、经济性倾向度和舒适度倾向度，建立负荷-电价响应特性模型；

步骤3：根据所述负荷-电价响应特性模型，得到各个负荷的总目标函数；

步骤4：设定负荷各个目标倾向度大小在0-1之间，所有目标的目标倾向度构成的集合称为负荷动作策略集合；将0-1等距离离散化m份，每个目标的目标倾向度均有m个选择；

步骤5：定义并初始化负荷的每个策略的倾向系数和概率系数；按概率选择各负荷的动作策略，将动作策略以Netlogo中的坐标形式表示出来，各个负荷分别运动到Netlogo三维层面中相应的位置上，不同的位置对应不同的策略；

设定网络节点初始电价，根据对应的负荷-电价响应特性模型，获得此时各个负荷的功率，并且结合负荷代理针对对应负荷的管辖，分别获得各个负荷代理的总功率；

步骤6：将所述各个负荷代理的总功率通过Matlab与Netlogo之间的数据交换接口模块，由Netlogo发送至Matlab中，在Matlab中分别针对各个负荷代理的总功率进行市场出清，获得对应各个网络节点的电价从而更新Netlogo中每个负荷节点的电价，再由每个负荷代理将节点电价下发给其所管辖的负荷；

步骤7：每个负荷对所选的策略进行计算以获得各负荷策略的学习效用，按照修正参数修改所述动作策略集合中各策略的被选概率，即所述概率系数，在系数调配合适的情况下，系统达到收敛状态，即某个动作策略被选择的概率趋近于1，则满足了强化学习过程中的终止条件，在未满足终止条件情况下，循环执行步骤5、6、7；

所述步骤2中，所述负荷-电价响应特性模型是将电价信号与负荷自身目标融合考虑的负荷模型，如下式所示：

其中Q_i为负荷需求量，Q_i0为负荷基准量，由负荷代理对供电专营区内终端用户的负荷预测取得；μ_i为经济性倾向度，为舒适度倾向度，ρ_i为供电公司向终端用户售电的电价；

所述负荷自身目标包括经济性和舒适度；

所述步骤3中，所述总目标函数R_i由各个目标函数乘以其相对应的目标倾向度后叠加而得，如下式所示：

B_i为负荷利润，C_i为负荷舒适度。

2.根据权利要求1所述的控制方法，其特征在于，所述多智能体通用模块包括通信属性子模块、智能属性子模块和物理属性子模块；

所述通信属性子模块用于模拟电力系统元件之间的信息交换过程；

所述智能属性子模块用于描述电力系统元件制定决策的过程；

所述物理属性子模块用于定义电力系统元件的运行状态。

3.根据权利要求1所述的控制方法，其特征在于，所述步骤1中，所述负荷代理管辖对应负荷节点下的所有负荷，并用于其管辖的各个负荷节点和Matlab之间的信息传输；

所述数据交互接口模块用于Matlab与Netlogo之间的数据交换。

4.根据权利要求1所述的控制方法，其特征在于，所述步骤6中，所述负荷根据初始电价以及当前策略，由负荷-电价响应特性模型得到此时每个负荷的功率，从而获得电网中负荷节点的负荷需求量；

采用Matlab中的最优潮流计算工具，根据此时电网的负荷需求量，计算出每个节点的电价及每台发电机出力情况。

5.根据权利要求1所述的控制方法，其特征在于，对于每个动作，所述负荷i都标有所述倾向系数q_i和所述概率系数p_i，而在控制过程中的策略更新方法如下：

假设所述负荷i的可选的策略集合为：

若在重复博弈D轮后策略被选中，其中x∈[0,m],y∈[0,m]，此时D轮更新倾向系数为q_i(x,y)(D)，D轮更新概率系数为p_i(x,y)(D)，负荷i此轮的目标值为profit_i(x,y)(D)；

则若在重复博弈D+1轮后策略被选中，其中x₁∈[0,m],y₁∈[0,m]，此时D+1轮更新倾向系数为：

式中，为策略在D轮被选中时的更新倾向系数，r为遗忘因子，为策略在D轮被选中时的总目标函数：当x₁≠x或y₁≠y时，当x₁＝x且y₁＝y时，其中e为一个经验参数，对于负荷在重复博弈早期学习阶段生成各种不同的报价策略起到鼓励作用；

此时D+1轮更新概率系数为：

负荷i根据新的选择概率，按照轮盘赌方式选择下一轮的策略行为，对于每个行为动作，负荷都标志有倾向系数q_i和概率系数p_i，每轮策略都根据总目标值更新。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院;国家电网公司;国网山东省电力公司电力科学研究院，未经中国电力科学研究院;国家电网公司;国网山东省电力公司电力科学研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510725409.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Netlogo与Matlab的负荷分布式控制方法有效

专利文献下载