[发明专利]一种基于强化学习算法的输电网扩展规划方法在审
申请号: | 202010605469.3 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111860969A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 沈力;魏明奎;王渝红;蔡绍荣;江栗;胡胜杰;路亮 | 申请(专利权)人: | 国家电网公司西南分部;四川大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06Q10/06 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 轩勇丽 |
地址: | 610041 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 算法 输电网 扩展 规划 方法 | ||
1.一种基于强化学习算法的输电网扩展规划方法,其特征在于,包括以下步骤:
步骤1:根据现状电网建设情况,确定线路待选集F,以线路待选集F为基础,构建强化学习的环境、状态、动作及对应智能体,构建适用于输电网扩展规划的QTEP算法;
步骤2:设定自适应因子λ,修正Q值计算方法,来提升QTEP算法的收敛速度;
步骤3:以规划周期内综合经济成本最小为目标构建目标函数,以电网运约束、N-1电网安全约及蒙特卡洛误差约束为约束条件,建立综合考虑经济性和可靠性的电网扩展规划优化模型;
步骤4:根据步骤3建立的优化模型,设计QTEP算法的综合特性反馈奖励函数和收敛条件,利用QTEP算法求解优化模型,得到综合考虑经济行和可行性的最优输电网扩展规划模型。
2.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤1所述的强化学习的环境、状态、动作及对应智能体,以及QTEP算法构建步骤为:
步骤1.1:根据现状电网建设情况,确定由n条线路组成的线路待选集F={l1,l2,…,lk,…,ln},其中lk为第k条待建设线路;
步骤1.2:构建QTEP算法环境为线路待选集F={l1,l2,…,lk,…,ln}本身,即所有可选的待建设线路;
步骤1.3:构建QTEP算法状态为智能体根据线路待选集F给出的当前规划方案;
步骤1.4:构建QTEP算法动作为改变当前规划方案的线路待选集状态;
步骤1.5:建立智能体动作更新策略,即每一次动作仅改变一条线路状态;
步骤1.6:构建QTEP算法智能体,智能体为状态和动作两个属性的集合。
3.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤2中设计的自适应因子λ,Q值计算方法修正为:
式中,Q(si,ai)为状态si下对应动作ai的Q值,为状态si下对应动作ai的反馈奖励,γ为折现率;为当智能体执行动作ai转移至状态si+1时,智能体在状态si+1下的建设线路的数量;n为待选线路总量。
4.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤3中的目标函数为规划方案投资成本与可靠性成本之和的最小值,投资成本为等年值法折算的年平均费用,可靠性成本通过蒙特卡洛等分散法求得。
5.根据权利要求4所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,
目标函数表达式为:
式中,Cf为综合经济成本;r为预期投资收益,a0为投资服务年限,a1为规划建设年限;ρ为线路年维护费用系数;F={l1,l2,…,ln}表示为由n条线路组成的线路待选集;为线路lk的投资成本;表示线路lk的建设情况,0表示为建设,1表示投建线路;Φ为系统状态集合,w为其中某一状态,系统转移至该状态的概率由PΦ(w)表示;Pw,b在该状态下的是节点b的缺供电量,而cw,b为其失电成本;Θ为节点集合,包含电力系统所有节点;T表示负荷持续总时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司西南分部;四川大学,未经国家电网公司西南分部;四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010605469.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全自动光斑测试机台
- 下一篇:一种无线广播授时信息处理方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理