[发明专利]基于场景和深度强化学习的虚拟电厂经济调度方法有效
申请号: | 202010701145.X | 申请日: | 2020-07-20 |
公开(公告)号: | CN111709672B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 胡本然;李俊;孙迪;彭宇;关心;房大伟 | 申请(专利权)人: | 国网黑龙江省电力有限公司;牡丹江大学;黑龙江大学 |
主分类号: | G06Q10/063 | 分类号: | G06Q10/063;G06Q50/06;G06Q10/04;G06V10/82;G06N3/0442;G06N3/0464;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 高倩 |
地址: | 150090 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 场景 深度 强化 学习 虚拟 电厂 经济 调度 方法 | ||
1.一种基于场景和深度强化学习的虚拟电厂经济调度方法,其特征在于,所述方法包括:
S1、建立虚拟电厂经济调度的目标函数及相应约束条件,使电力系统正常运行;
S2、根据设定阈值对历史数据进行分类,分为极端场景的数据和常态场景的数据;
S3、利用生成式对抗网络GAN分别对极端场景的数据和常态场景的数据进行扩充,获取极端场景数据集和常态场景数据集;
S4、利用深度确定性策略梯度算法,分别以极端场景数据集及常态场景数据集作为训练集,对神经网络进行训练,求解目标函数的参数,确定虚拟电厂经济调度策略;
所述S2中,通过夜间用电高峰的平均用电值作为设定阈值,将历史数据与该设定阈值进行对比,超过该设定阈值的历史数据为极端场景数据,否则,作为常态场景数据;
所述S3包括:
S31、生成式对抗网络GAN包括生成网络模型G和辨别网络模型D;
S32、利用极端场景和常态场景的历史真实数据分别对生成式对抗网络GAN进行训练,获取极端场景数据生成网络模型G和常态场景数据生成网络模型G,训练过程包括:
将历史真实数据和随机噪声输入到生成网络模型G,生成网络模型G用于生成与所述真实数据相同类型的数据;
将极端场景或常态场景的真实数据与生成网络模型G生成的数据同时输入至辨别网络模型D中,辨别网络模型D用于判断生成网络模型G生成的数据是真实数据分布的概率;
通过真实数据与生成的数据的JS散度来更新辨别网络模型D,通过辨别网络模型D的结果来对于生成网络模型G进行训练,直到生成的数据是真实数据分布的概率大过设定值,停止训练;
S33、利用训练好的极端场景数据生成网络模型G和常态场景数据生成网络模型G分别对极端场景的数据和常态场景的数据进行扩充,获取极端场景数据集和常态场景数据集;
所述方法S4中:
S41、根据目标函数确定状态集和动作集,其中动作集中的a为:
a=πθ(s)+N
其中,πθ(s)表示输入状态s时的动作集合的概率分布情况,N表示噪声;
S42、构建深度确定性策略梯度算法中的Critic网络和Actor网络;
S43、设定Critic网络中估计网络的损失函数为:
其中,J(ω)表示训练时的均方误差,Q(sj,aj,ω)表示表示(sj,aj)时以ω参数的行为值函数,sj表示状态,aj表示动作,yj表示行为值函数的真实值,m表示经验回放池的大小;
设定Actor网络中估计网络的损失梯度为:
Actor网络中的估计网络的损失函数为:
S44、以极端场景数据集或常态场景数据集作为训练集,训练Critic网络中的估计网络和Actor网络中的估计网络,并根据Critic网络中的估计网络的损失函数、Actor网络中的估计网络的损失梯度及其损失函数,对Critic网络中的估计网络和Actor网络中的估计网络的参数进行更新:
ω′←τω+(1-τ)ω′
θ′←τθ+(1-τ)θ′
其中,ω′表示Critic网络中的目标网络的参数;
θ′表示Actor网络中的目标网络的参数;
ω表示Critic网络中的估计网络的参数;θ表示Actor网络中的估计网络的参数;τ是更新系数。
2.根据权利要求1所述的基于场景和深度强化学习的虚拟电厂经济调度方法,其特征在于,所述约束条件包括功率平衡约束、传统能源出力约束、新能源出力约束、储能容量约束、储能充放电约束和配电网交互约束。
3.根据权利要求2所述的基于场景和深度强化学习的虚拟电厂经济调度方法,其特征在于,所述目标函数为:
T表示时域;/表示传统能源发电机的数量;表示传统能源的成本函数,Ut,E表示储能的成本函数,Ut,p表示与配电交互电力的成本函数,表示在t时刻传统能源发电机i的输出功率;Δpt表示在t时刻购买或出售配电网络的电力数量;Et,d和Et,c分别表示在t时刻能源存储管理系统ESS的放电功率和充电功率;
功率平衡约束为:
其中,表示功率是在t时刻由光伏发电机j输出的,J是光伏发电机的数量;
表示功率是在t时刻由风力涡轮发电机k输出的,K是风力涡轮发电机的数量,Pt,D是用户负载的需求;表示在t时刻台风力涡轮发电机k的输出功率;
传统能源出力约束:
表示传统能源的成本,α,β,γ是正常数成本因子,是传统能源发电机i输出的最小功率,是输出的最大功率;
新能源出力约束:
其中,和分别是光伏发电机j和风力发电机k的额定功率;
储能容量约束:
Emin≤Et≤Emax,
Et表示为t时刻储能的状态,Emin和Emax分别表示储能容量的上下限,ηch表示储能充电因子,ηdis表示储能放电因子;Δt表示时间变化;表示t时刻的储能的充电电量;表示表示t时刻的储能的放电电量;
储能充放电约束:
其中和分别表示为单次充放电的最大值,并且在同一时刻储能只能进行充电或者放电单一操作;
0≤Bc+Bd≤1,
Bc,Bd∈[0,1],
其中,Bc和Bd分别表示充放电的状态,是一个二进制变量,取值0或1;
配电网交互约束:
Ut,p(Δpt)=Δpt.pg,
其中和表示与配电网交互电力的上限和下限,pg表示最低购电价格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网黑龙江省电力有限公司;牡丹江大学;黑龙江大学,未经国网黑龙江省电力有限公司;牡丹江大学;黑龙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010701145.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理