[发明专利]深度Q网络驱动的电力系统运行方式自动趋优调整方法有效
申请号: | 202010478336.4 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111523737B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 刘友波;刘季昂;刘俊勇;田蓓;顾雨嘉;李宏强 | 申请(专利权)人: | 四川大学;国网宁夏电力有限公司电力科学研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/06;G06N3/04;G06N3/08;G06N3/00 |
代理公司: | 成都时誉知识产权代理事务所(普通合伙) 51250 | 代理人: | 何悦 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 网络 驱动 电力系统 运行 方式 自动 调整 方法 | ||
1.深度Q网络驱动的电力系统运行方式自动趋优调整方法,其特征在于,包括以下步骤:
S1:以典型运行方式为调整的基准方式,确定负荷波动范围,并结合拉丁超立方抽样方法生成大量用于训练和测试的目标方式样本数据;
S2:确定电网模型中所有可行的单次控制动作,并进行编号,将其设定为动作空间;
S3:初始化电网模型,判断是否存在未训练过的样本,若存在则将样本中的负荷数据赋值给电网模型,并对当前运行方式发电机出力数据进行收敛性优化处理,若不存在则终止训练;
S4:进行潮流计算,并归一化处理计算后得到的状态数据,存入至状态向量s中;在电网的结构参数和负荷情况已经给定的情况下,状态向量s表示为:
s={PG,V,Pline,Tp_pos}
其中,PG表示当前状态下的发电机功率;V表示节点电压;Pline表示线路的有功功率;Tp_pos表示变压器抽头的档位;
S5:搭建深度神经网络并进行训练,对当前电网状态s中各项数据和动作空间中各调整动作的动作值进行拟合;
S6:根据ε-贪婪策略从动作空间中选取调整动作a执行,并计算潮流,获得新状态向量s’;
S7:判断状态s’是否满足约束条件,若满足条件则根据奖励函数给出奖励r,并将数据以向量(s,a,r,s’)的形式存至记忆单元D中,若不满足条件则给出惩罚;
S8:从记忆单元D中采样若干样本训练深度神经网络,并使用随机梯度下降方法更新深度神经网络参数θ;
S9:判断状态s’是否满足终止条件,若满足条件则回到S3,若不满足条件则回到S5。
2.根据权利要求1所述的深度Q网络驱动的电力系统运行方式自动趋优调整方法,其特征在于,
所述步骤S1具体为:
拉丁超立方抽样方法:将样本的取值范围根据抽样个数均分为N等份,在每份内选取一个样本,使其能遍布整个样本空间,且具有一定的随机性;
以电网典型运行方式的负荷数据为基准,随机负荷波动为80%至120%,并且,在原有数据上添加扰动,最终生成N个样本数据。
3.根据权利要求2所述的深度Q网络驱动的电力系统运行方式自动趋优调整方法,其特征在于,
所述步骤S2具体为:
选取电网模型中所有可行的单次控制动作,将其设定为动作空间A,其中包括了发电机出力动作aG、变压器抽头动作aT和无功补偿动作aC;发电机出力动作分为+△和-△两种状态,其中△表示发电机功率的调整幅度;变压器抽头动作又分为升一档和降一档两种状态;无功补偿动作则包括了投入和切出两种状态,即:
A={aG,aT,aC}
将电网模型中所有的单次控制动作进行编号,并与调整策略形成映射。
4.根据权利要求3所述的深度Q网络驱动的电力系统运行方式自动趋优调整方法,其特征在于,
所述步骤S3具体为:
对当前电网运行方式的发电机出力进行收敛性优化处理:即求取负荷数据的总变化量,并将变化量均摊至每台发电机;此时,智能体可获得一个更接近目标方式可行域的初始运行方式来开始训练。
5.根据权利要求4所述的深度Q网络驱动的电力系统运行方式自动趋优调整方法,其特征在于,
所述步骤S4具体为:
对相关数据进行归一化处理:
其中,ηk表示对数据归一化处理后的结果;xk表示电网方式状态数据的第k个数据值;N表示此项数据的个数;xk,max和xk,min表示此项数据的上下限值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学;国网宁夏电力有限公司电力科学研究院,未经四川大学;国网宁夏电力有限公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010478336.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理