[发明专利]一种分布式资源协同调度的多智能体强化学习方法在审
申请号: | 202310401017.7 | 申请日: | 2023-04-14 |
公开(公告)号: | CN116542137A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 谈竹奎;刘斌;张俊玮;冯圣勇;潘旭辉;何龙;王秀境;徐长宝;张秋雁;徐玉韬;唐赛秋;徐宏伟;陈敦辉 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/092;G06N3/006;H02J3/38;G06F113/04;G06F111/04 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 周局 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 资源 协同 调度 智能 强化 学习方法 | ||
1.一种分布式资源协同调度的多智能体强化学习方法,其特征在于:包括,
建立分布式设备接入配网的仿真环境;
搭建不同分布式设备强化学习的智能体;
所述智能体与所述仿真环境交互训练;
通过训练好的所述智能体进行决策。
2.如权利要求1的一种分布式资源协同调度的多智能体强化学习方法,其特征在于:所述仿真环境,具体包括:
所述分布式设备接入的配电网需要满足电力系统潮流方程约束、电压安全稳定约束、储能设备运行约束、分布式光伏设备约束、电动汽车聚合商约束条件,所述分布式设备接入后,根据所述分布式设备给出的决策评价其决策的优劣并以奖励值的形式返回到所述智能体中。
3.如权利要求1或2的一种分布式资源协同调度的多智能体强化学习方法,其特征在于,所述电力系统潮流方程约束:
式中,Pmt,i,t和Qmt,i,t为节点i发电机组在t时刻的有功、无功功率;Pload,i,t,Qload,i,t为节点i在t时刻的有功、无功负荷;Ppv,i,t,Pess,i,t,PEVA,i,t分别为节点i在t时刻的分布式光伏、储能和电动汽车聚合商的有功功率;Ui,t为节点i的电压模值;Uj,t为节点j的电压模值;θij,t为两节点间的相角差;Gij,Bij分别是节点i、j之间的电导和电纳;
所述储能设备运行约束:
式中,Eess,i为节点i处储能的容量,Sess,i,max,Pess,i,max,Qess,i,max分别为节点i处视在功率、有功和无功功率上限,Socess,i,max,Socess,i,min是储能荷电状态的上、下限,Socess,i,t是节点储能荷电状态的ηc,ηd为储能的充、放电效率,eess,i,t为第t时刻节点i处当前时刻储存的能量,Δt表示t时刻的增量;
所述分布式光伏设备约束,
Ppv,i,min<Ppv,i,t<Ppv,i,max
式中Ppv,i,max和Ppv,i,min分别表示在第t时刻节点i的分布式光伏设备能够输出的最大功率和最小功率,Ppv,i,t,表示在第t时刻节点i的分布式光伏设备的输出功率;
所述电动汽车聚合商约束,
式中Pup,t和Pdown,t分别表示在第t时刻电动汽车聚合商参与功率下调及上调控制的可调节容量,为电动汽车聚合商的最大输出功率,Pev,t为t时刻电动汽车聚合商的输出功率。
4.如权利要求1的一种分布式资源协同调度的多智能体强化学习方法,其特征在于:所述智能体,包括:
不同分布式设备强化学习的所述智能体,从所述仿真环境中获取的状态、输出的动作空间以及奖励函数。
5.如权利要求4的一种分布式资源协同调度的多智能体强化学习方法,其特征在于:不同分布式设备强化学习的所述智能体,还包括:
不同的布式设备强化学习的所述智能体有各自的状态空间和动作空间,所述智能体能够根据各自的目标进行参数更新达到自适应学习的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310401017.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高尔夫球杆袋
- 下一篇:塑封料组合物及其在SIP封装中的应用