[发明专利]基于深度强化学习的能源互联网中虚拟电厂经济调度方法有效
申请号: | 202010010410.X | 申请日: | 2020-01-06 |
公开(公告)号: | CN111242443B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 孙迪;王宁;关心;林霖 | 申请(专利权)人: | 国网黑龙江省电力有限公司;黑龙江大学 |
主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06Q50/06 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150090 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 能源 互联网 虚拟 电厂 经济 调度 方法 | ||
1.基于深度强化学习的能源互联网中虚拟电厂经济调度方法,其特征在于,该方法包括以下步骤:
步骤一、对于任意区域i,利用区域i的工业侧服务器和电源侧服务器收集来自于区域i的发电侧和用户侧信息,i=1,2,…,I,I为区域总个数;
利用各区域收集的信息分别对actor-critic网络进行训练,以分别获得利用各区域信息训练好的actor-critic网络;
所述actor-critic网络的目标函数为:
其中:C为区域i的总运营成本,为区域i在时隙k的光伏投资初始折旧成本,k=0,1,…,K,为区域i在时隙k的光伏运营和维护成本,为区域i在时隙k的风力涡轮机初始折旧成本,为区域i在时隙k的风力涡轮机运行和维护成本,为区域i在时隙k的微型燃气轮机初始折旧成本,为区域i在时隙k的微型燃气轮机运行和维护成本,为区域i在时隙k的微型燃气轮机环保成本,为区域i在时隙k的微型燃气轮机自身消耗的成本,λ为补偿系数,为区域i在时隙k的可控制负载,xi(k)为区域i在时隙k的选择可中断负载百分比向量,xi(k)的取值范围为[0,1];
所述actor-critic网络中的actor网络的具体训练过程为:
所述actor网络由mu网络和sigma网络构成,且mu网络和sigma网络均由2个全连接层构成;
mu网络和sigma网络的第1个全连接层的激活函数均为tanh,输入维度均为5,输出维度均为h;
mu网络和sigma网络的第2个全连接层的激活函数均为softplus,输入维度均为h,输出维度均为m;
将发电侧和用户侧的信息输入mu网络和sigma网络后,获得mu网络和sigma网络的输出;再对mu网络和sigma网络的输出进行正态随机采样,获得actor网络输出的4维动作;
所述actor-critic网络中的critic网络的具体训练过程为:
所述critic网络由全连接层构成;
将发电侧和用户侧的信息和actor网络输出的4维动作输入critic网络的全连接层后,再将全连接层的输出进行拼接,获得拼接结果,并对拼接结果进行线性变换,获得critic网络输出的一维回报值;
步骤二、将训练好的actor-critic网络分别部署在对应区域的边缘节点;
步骤三、各区域的工业侧服务器和电源侧服务器实时收集来自于发电侧和用户侧的信息,并将收集的信息输入对应边缘节点上的actor-critic网络,实时获得各区域的决策信息。
2.根据权利要求1所述的基于深度强化学习的能源互联网中虚拟电厂经济调度方法,其特征在于,所述步骤一中,利用各区域收集的信息分别对VPP运营商云服务器的actor-critic网络进行训练,采用的是异步的方法,同时并行运行8个线程。
3.根据权利要求2所述的基于深度强化学习的能源互联网中虚拟电厂经济调度方法,其特征在于,所述actor-critic网络的回报函数的表达式为:
其中:K1、K2、K3和K4均为权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网黑龙江省电力有限公司;黑龙江大学,未经国网黑龙江省电力有限公司;黑龙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010410.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理