[发明专利]一种电力系统经济调度决策的方法、系统、装置及介质在审
申请号: | 202111535326.0 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114358520A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 陈俊斌;潘振宁;余涛;丁茂生;杨慧彪;王运 | 申请(专利权)人: | 华南理工大学;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
地址: | 510641 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力系统 经济 调度 决策 方法 系统 装置 介质 | ||
1.一种电力系统经济调度决策的方法,其特征在于,包括以下步骤:
获取电力系统的第一运行状态数据,根据所述第一运行状态数据构建第一运行状态图;
构建融入图卷积神经网络的图强化学习模型;
根据奖励机制,采用所述第一运行状态图对所述图强化学习模型进行训练;
获取电力系统的第二运行状态数据,根据所述第二运行状态数据构建第二运行状态图,将所述第二运行状态图输入训练后所述图强化学习模型,输出电力系统的经济调度决策;其中,所述运行状态图中的节点为电力系统的节点,所述运行状态图中的边为电力系统的拓扑连接关系。
2.根据权利要求1所述的一种电力系统经济调度决策的方法,其特征在于,所述节点的节点特征包括该节点的有功负荷数据、无功负荷数据、所接发电机出力数据、风电数据或光伏数据。
3.根据权利要求1所述的一种电力系统经济调度决策的方法,其特征在于,所述图强化学习模型包括行动器模块和评判器模块,所述构建融入图卷积神经网络的图强化学习模型,包括:
构建图卷积神经网络,所述图卷积神经网络用于对节点的消息进行传递、转换和聚合,以实现节点特征的提取;
构建融合所述图卷积神经网络的行动器模块,所述行动器模块以运行状态图作为输入,输入的运行状态图经过所述图卷积神经网络进行特征提取后,再经过所述行动器模块的全连接层,获得动作策略;
构建融合所述图卷积神经网络的评判器模块,将经过所述图卷积神经网络进行特征提取的运行状态图和所述动作策略,输入所述评判器模块的全连接层,获得状态动作对的Q值。
4.根据权利要求3所述的一种电力系统经济调度决策的方法,其特征在于,所述节点特征的提取采用以下公式表示:
式中,为第i个节点经过k次卷积后的节点特征;ei,j为边的权重;Γ表示可导的,γ和φ表示可导的函数。
5.根据权利要求3所述的一种电力系统经济调度决策的方法,其特征在于,所述动作策略和Q值更新的方式如下:
γE{Vt+1(st+1)|st,at+αH[π(·|st)]}
其中,π*为最优动作策略;r(st,at)是状态动作对的即时奖励,st是时刻t的系统观测状态,at是时刻t的动作策略;为期望算子;γ是折扣因子;Vt+1(st+1)表示状态St+1的值函数;H[·]表示动作集合的熵;α为温度系数的权重;Q(st,at)表示状态动作对(st,at)的Q值。
6.根据权利要求3所述的一种电力系统经济调度决策的方法,其特征在于,所述行动器模块和所述评判器模块的更新方式如下:
式中,JQ(ω)表示行动器网络更新所需的的残差;π表示动作策略;ω为Q网络参数,为目标Q网络参数,θ为政策网络参数,λ为软更新系数。
7.根据权利要求1所述的一种电力系统经济调度决策的方法,其特征在于,所述一种电力系统经济调度决策的方法,还包括以下步骤:
在应用所述图强化学习模型时,根据上一个时间段的运行状态图、模型输出的经济调度决策以及电力系统真实运行调度数据获得即时奖励,作为所述图强化学习模型的输入,对所述图强化学习模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院,未经华南理工大学;国网宁夏电力有限公司;国网宁夏电力有限公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111535326.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理