[发明专利]一种基于深度强化学习的配电网拓扑电压调节方法有效

申请号：	202110511579.8	申请日：	2021-05-11
公开（公告）号：	CN113036772B	公开（公告）日：	2022-07-19
发明（设计）人：	许洪华;刘少君;王文帝;杨林青;胥鹏;王蓓蓓	申请（专利权）人：	国网江苏省电力有限公司南京供电分公司;东南大学
主分类号：	H02J3/12	分类号：	H02J3/12
代理公司：	北京同辉知识产权代理事务所(普通合伙) 11357	代理人：	何静
地址：	210000 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度强化学习配电网拓扑电压调节方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种基于深度强化学习的配电网拓扑电压调节方法，属于配网电压调节技术领域；调节方法包括：采集配电网历史运行数据作为深度强化学习模型的学习样本数据、根据深度强化学习对于基于拓扑的配电网调压问题进行建模、输入当前状态，基于深度强化学习中的Q值网络，根据动作策略从配电网当前闭合支路中选择一条支路断开、根据潮流计算结果计算奖励，并得到下一状态，将当前状态、动作、奖励以及下一状态保存以供Q值网络的训练、深度强化学习智能体根据记忆池中的数据进行Q值网络的参数更新，直到得到学习终止条件；缓解了传统配网调压资源逐渐满足不确定性电网调压需求的问题，节省外部调节设备的建设成本，保证电网安全经济运行。

技术领域

本公开属于配网电压调节技术领域，具体涉及一种基于深度强化学习的配电网拓扑电压调节方法。

背景技术

传统的配电网电压调节主要依赖于外部安装的设备，包括变电站有载调压器、智能逆变器和并联电容器等，并且只有智能逆变器被用于在线电压调节；近年来配电网中飞速发展的分布式电源加大了配电网调压的压力，导致出现已有调压资源无法完全满足在线调压需求的情况，而随着智能电网的发展出现了灵活性拓扑结构这一新型在线调节资源，可作为配电网的一种在线调节资源。

发明内容

针对现有技术的不足，本公开的目的在于提供一种基于深度强化学习的配电网拓扑电压调节方法，解决了现有配网电压调节资源的不足的问题。

本公开的目的可以通过以下技术方案实现：

一种基于深度强化学习的配电网拓扑电压调节方法，其特征在于，

步骤1：采集配电网历史运行数据作为深度强化学习模型的学习样本数据，包括分布式电源出力、负荷水平数据；

步骤2：根据深度强化学习对于基于拓扑的配电网调压问题进行建模，包括状态、动作、Q值网络结构以及奖励函数的定义；

步骤3：输入当前状态，基于深度强化学习中的Q值网络，根据ε-greedy动作策略从配电网当前闭合支路中选择一条支路断开；

步骤4：根据图论计算当前配电网拓扑下所述步骤2断开支路所对应的基本割集，选择基本割集中的最优支路断开，根据潮流计算结果计算奖励，并得到下一状态，将当前状态、动作、奖励以及下一状态保存以供Q值网络的训练；

步骤5：深度强化学习智能体根据记忆池中的数据进行Q值网络的参数更新，直到得到学习终止条件。

进一步地，在所述步骤2中的状态定义过程中，将状态表示为以下形式：

s＝(G,P_net,Q_net)

where G＝(V,L)