[发明专利]基于深度强化学习的完全分布式智能电网经济调度方法有效
申请号: | 201911206937.3 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110929948B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 符杨;郭笑岩;米阳;张智泉;丁枳尹;袁明瀚;李振坤;田书欣 | 申请(专利权)人: | 上海电力大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/06;G06N3/08;G06N20/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 王怀瑜 |
地址: | 200090 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 完全 分布式 智能 电网 经济 调度 方法 | ||
1.一种基于深度强化学习的完全分布式智能电网经济调度方法,其特征在于,该方法包括以下步骤:
S1:获取完全分布式智能电网的网络拓扑结构数据,建立基于负荷分配和机组组合的经济调度模型;
S2:初始化Q函数表和调度策略,并通过深度强化学习模型获取所述经济调度模型的局部最优解,并将所述局部最优解作为第一Q函数表;
S3:将第一Q函数表载入预训练后的深度卷积神经网络中进行更新,获取第二Q函数表;
S4:根据第二Q函数表,初始化各个机组的功率,将各个机组的功率载入基于一致性原理的机组功率求解模型中,并根据网络拓扑结构数据,获取满足预设的收敛条件的各机组的功率,从而更新第二Q函数表,获取全局最优解;
S5:采用全局最优解进行智能电网经济调度;
所述Q函数表包括状态-动作值函数;
步骤S3中,所述深度卷积神经网络的预训练过程具体为,通过随机梯度下降更新网络参数,从而更新第一Q函数表,直到满足预设的误差条件;所述网络参数的更新表达式为:
式中,ωt为t时刻的网络参数,ωt+1为t+1时刻的网络参数,为t时刻的网络参数下的随机梯度下降策略,ξ为深度卷积神经网络的学习率,reward2t为深度卷积神经网络在t时刻的奖励函数值,γ为折扣因子,Q(Si,t,Pi,t)为第i个可调单元在t时刻的状态-动作值函数,Q(Si,t+1,Pi,t+1)为第i个可调单元在t+1时刻的状态-动作值函数;
所述误差条件根据误差函数值设定,所述误差函数值的计算表达式为:
式中,L(ωt)为t时刻的网络参数下的误差函数值。
2.根据权利要求1所述的一种基于深度强化学习的完全分布式智能电网经济调度方法,其特征在于,步骤S1中,所述基于负荷分配和机组组合的经济调度模型的表达式包括:
目标函数:
约束条件:
Pi,t∈P(Si,t)
式中,γ为折扣因子,γt-1为t-1时刻的累计折扣因子,Fi(·)为经济成本函数,Pi,t为第i个可调单元在t时刻的出力,Si,t为第i个可调单元在t时刻的状态,Ploss为功率损失,Dt为t时刻不可调的总刚性负荷,Nc为已投入的可调单元的总个数;所述可调单元包括可调单元与柔性负荷单元,所述可调单元出力为正值,所述柔性负荷单元出力为负值;
Fi(·)=Ci(Pi,t)Ii,t+Ci,SU(t)+Ci,SD(t)
式中,Ci(·)为可调单元运行时的成本函数,Ii,t=1或0为第i个可调单元在第t时段内处于投入运行或停机状态,Ci,SD(t)为t时刻的停机成本,Ci,SU(t)为t时刻的启动成本,若Ti,D≤Xi,OFF(t)≤Ti,D+Ti,b2c,则t时刻的启动成本Ci,SU(t)为热启动成本Ci,hot;若Xi,OFF(t)≥Ti,D+Ti,b2c,则t时刻的启动成本Ci,SU(t)为冷启动成本Ci,cold,Ti,D为第i个可调单元的最短持续停机时间,Xi,OFF(t)为第i个可调单元在t时刻已经连续处于停机状态的时间,Ti,b2c为第i个可调单元选择停机状态冷却模式的经济性超越停机状态热态模式时的临界时间;
式中,Ti=max{Ti,U,Ti,D,Ti,b2c},Pi,0为第i个可调单元的初始出力状态,Ii,0为第i个可调单元的初始运行状态,Pi,t-1为第i个可调单元在t-1时刻的出力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911206937.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理