[发明专利]一种风场协同控制方法及装置有效
申请号: | 202010035870.8 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111245008B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 赵俊华;赵焕;梁高琪 | 申请(专利权)人: | 香港中文大学(深圳) |
主分类号: | H02J3/38 | 分类号: | H02J3/38;H02J3/46 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 袁文英 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 协同 控制 方法 装置 | ||
1.一种风场协同控制方法,其特征在于,所述控制方法包括以下步骤:
接收风场系统中神经网络单元发送的初始代理状态,及接收所述神经网络单元发送的初始代理行为,所述初始代理行为为所述初始代理状态对应的行为;
基于预设的风场分析模型,利用所述初始代理状态及所述初始代理行为确定预执行行为,并确定所述预执行行为的引导奖励;
根据所述引导奖励的收益确定奖励参数,并根据所述奖励参数及所述预执行行为更新所述神经网络单元,得到新的代理状态及新的代理行为,直至所述代理状态及所述代理行为确定的执行行为收敛;
根据所述执行行为生成控制行为信号,利用所述控制行为信号控制所述风场系统;
其中,所述基于预设的风场分析模型,利用所述初始代理状态及所述初始代理行为确定预执行行为,及确定所述预执行行为的引导奖励的步骤包括:
基于所述风场分析模型获取所述初始代理状态对应的标准行为,依照所述标准行为将所述初始代理行为更新为所述预执行行为;
所述标准行为的公式如下:
ac=arg max K(st,ac,t)
其中,ac表示所述标准行为,st表示t时刻的观察状态,ac,t表示t时刻的所述标准行为,K表示所述风场分析模型函数;
所述预执行行为的计算公式如下:
ae=(1-γi)·ao+γi·ac
其中,ae表示所述预执行行为,γ表示折现因子,i表示迭代次数,ao表示所述代理行为,ac表示所述标准行为;
基于所述风场分析模型确定所述预执行行为对应的引导奖励,所述引导奖励的计算公式如下:
rg,t=E(st,ae,t)
其中,rg,t表示t时刻的引导奖励,E表示用于评估的所述风场分析模型,st表示t时刻的观察状态,ae,t表示t时刻的预执行行为。
2.如权利要求1所述的风场协同控制方法,其特征在于,所述神经网络单元包含:Q网络及策略网络;
则所述接收风场系统中神经网络单元发送的初始代理状态,及接收所述神经网络单元发送的初始代理行为的步骤之前包括:
将所述Q网络进行初始化处理,得到初始代理状态,所述Q网络的表达式如下:
Q(a,s|θQ)
其中,a表示所述行为,s表示观察状态,θQ表示Q网络参数;
将所述策略网络进行初始化处理,得到初始代理行为,所述策略网络的表达式如下:
μ(s|θμ)
其中,s表示所述观察状态,θμ表示策略网络参数;
所述初始代理行为的计算公式如下:
ao,t=μ(st|θμ)+Nt
其中,ao,t表示t时刻的代理行为,μ(st|θμ)表示所述策略网络选择的所述代理行为,st表示t时刻的观察状态,θμ表示策略网络参数,Nt表示高斯噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于香港中文大学(深圳),未经香港中文大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010035870.8/1.html,转载请声明来源钻瓜专利网。