[发明专利]一种面向工业互联网的博弈控制系统建模与均衡求解方法在审

专利信息
申请号: 202211679508.X 申请日: 2022-12-27
公开(公告)号: CN115664981A 公开(公告)日: 2023-01-31
发明(设计)人: 高庆;蔡鑫江;吕金虎;刘昊;王振乾;王薇 申请(专利权)人: 北京航空航天大学
主分类号: H04L41/14 分类号: H04L41/14;H04L41/142
代理公司: 北京天汇航智知识产权代理事务所(普通合伙) 11987 代理人: 陈陈数
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 工业 互联网 博弈 控制系统 建模 均衡 求解 方法
【权利要求书】:

1.一种面向工业互联网的博弈控制系统建模与均衡求解方法,其特征在于,包括以下步骤:

步骤一、根据工业互联网实际背景对博弈控制系统进行建模,确定系统状态方程及各博弈参与者的代价函数;

步骤二、设计动态反馈均衡策略,重新确定系统状态方程与各博弈参与者的代价函数;

步骤三、根据各博弈参与者的代价函数,定义系统各博弈参与者在时刻k的累积代价函数;

步骤四、根据系统状态方程以及各博弈参与者的累积代价函数,迭代求解各时刻的最优动态反馈均衡策略。

2.根据权利要求1所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法,其特征在于,所述步骤一中,博弈控制系统的建模方式具体为:将工业互联网场景中服从上级调控的个体利益维护者抽象为博弈控制系统的跟随者,其个数为n,将以特定目的调控各跟随者的系统整体利益维护者抽象为博弈控制系统的领导者,其个数为m

博弈控制系统的状态方程通过一阶差分方程进行描述:

其中表示系统状态,为第i个领导者的决策,为第j个跟随者的决策,表示时刻,A为描述系统当前时刻状态与下一时刻状态更新关系的给定矩阵,为描述第i个领导者决策对下一时刻系统状态影响关系的给定矩阵,为描述第j个跟随者决策对下一时刻系统状态影响关系的给定矩阵。

3.根据权利要求2所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法,其特征在于,所述步骤二中,动态反馈均衡策略的具体设计方法为:设计动态反馈:

其中描述第i个领导者的策略更新方式,描述第j个跟随者的策略更新方式;

对进行扩维,记;通过代数变换,得到新的系统状态方程如下:

其中

即为第i个参与者的动态反馈均衡策略,即为第j个跟随者的动态反馈均衡策略,表示p维单位矩阵。

4.根据权利要求3所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法,其特征在于,所述步骤三中,累积代价函数具体为:利用动态规划的思想,将第l个博弈参与者在时刻k采取策略,从时刻k+1直到终止时刻N一直采取最优策略付出的代价之和定义为累积代价函数;其中。

5.根据权利要求4所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法,其特征在于,所述步骤四中,迭代求解各时刻的最优动态反馈均衡策略具体为:

S41、对时刻k和黎卡提矩阵进行初始化;

S42、将领导者的决策信息作为跟随者决策的参数,求解时刻k时各跟随者的最优反应策略;

S43、将S42中求出的跟随者的最优反应策略作为领导者策略求解过程中的约束条件,得到时刻k时领导者的最优动态反馈均衡策略;

S44、根据S43求得的时刻k时领导者的动态反馈均衡策略,得到时刻k时跟随者的最优动态反馈均衡策略;

S45、更新时刻k的黎卡提矩阵;

S46、令,若,转S42继续执行求解,否则求解结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211679508.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top