[发明专利]一种基于强化学习的风蓄生态发电日随机优化调度方法在审
申请号: | 202210318978.7 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114881404A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 严展鹏;李文武;黄颖峰;郑传良;伍仰金;郭茜婷;陈峥;叶家玮;高勉伟;杨丹丹;谢鸿 | 申请(专利权)人: | 国网福建省电力有限公司宁德供电公司;国网福建省电力有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06Q50/06;H02J3/00;H02J3/28;H02J3/38;H02J3/46 |
代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 何小星 |
地址: | 352100 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 生态 发电 随机 优化 调度 方法 | ||
本发明涉及一种基于强化学习的风蓄生态发电日随机优化调度方法,包括:预先构建目标函数,所述目标函数以风电‑抽蓄联合系统实际出力与计划出力偏差平方的期望值最小为目标;获取当前风电出力实际值和风电出力预测值;利用Q(λ)‑learning算法迭代求解目标函数,得到调度策略:将当前水库容量作为状态初始值,利用启发式贪婪策略在水库进出流量集中选取动作,利用资格迹函数提取动作资格,利用启发函数提取动作的启发信息;计算执行当前动作的奖励值并更新Q值,得到Q值表;根据Q值表确定调度策略。
技术领域
本发明涉及一种基于强化学习的风蓄生态发电日随机优化调度方法,属于风蓄优化调度领域。
背景技术
大力发展水电站调度体系,可满足各流域水文站建设,提升发电、航运等实用能力,提高水电站整体效益。其中,风电-抽水蓄能联合系统随机优化调度问题是一个高维、多阶段、非线性优化的问题,此问题约束较为复杂,综合考虑的因素较多。在解决此类随机优化调度问题时,常用的求解算法包括粒子群算法、随机动态规划算法等。然而随着系统规模的扩大,在求解的过程中这些算法可能会存在一定的局限性,例如粒子群算法在寻优过程中容易陷入局部最优解,计算过程中需要跳出局部最优,很难找到理论上的全局最优解;而随机动态规划算法虽然可以找到理论上的最优解,但是在求解过程中容易出现“维数灾”,导致求解时间过长,在实际中较难取得应用。
因此,需要一种求解速度更快的风蓄生态发电日随机优化调度方法。
发明内容
为了克服现有技术中存在的问题,本发明设计了一种基于强化学习的风蓄生态发电日随机优化调度方法。
为了实现上述目的,本发明采用如下技术方案:
一种基于强化学习的风蓄生态发电日随机优化调度方法,其特征在于,包括以下步骤:
预先构建目标函数,所述目标函数以风电-抽蓄联合系统实际出力与计划出力偏差平方的期望值最小为目标;
获取当前风电出力实际值和风电出力预测值;
利用Q(λ)-learning算法迭代求解目标函数,得到调度策略:
将当前水库容量作为状态初始值,利用启发式贪婪策略在水库进出流量集中选取动作,利用资格迹函数提取动作资格,利用启发函数提取动作的启发信息;计算执行当前动作的奖励值并更新Q值,得到Q值表;根据Q值表确定调度策略。
进一步地,还包括:利用服从Beta分布的风电预测误差概率密度函数修正风电出力预测值。
进一步地,预先构建目标函数,具体为:在一个优化周期内,以风电-抽蓄联合系统实际出力与计划出力偏差平方的期望值最小为目标,构建目标函数并设置目标函数的约束条件。
进一步地,利用状态转移方程更新状态,状态转移方程为:
式中:Vt、Vt+1分别为t时段初、末上水库的库容;Qc为t时段的抽水流量,m3/s;Qfd为t时段的发电流量,m3/s;ΔT为t时段进行发电/抽水的时间。
进一步地,根据风电出力实际值与预测值的偏差值,计算奖励值。
进一步地,所述启发式贪婪策略以公式表达为:
式中:Ht(st,at)为启发函数,ξ为启发函数的权值,用于加权启发函数对于动作选择的影响,ξHt(st,at)为选取动作的启发信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司宁德供电公司;国网福建省电力有限公司,未经国网福建省电力有限公司宁德供电公司;国网福建省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210318978.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种采用音圈电机的载台系统
- 下一篇:一种用于鲜红斑痣的监测系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理