[发明专利]一种面向工业互联网的博弈控制系统建模与均衡求解方法在审

申请号：	202211679508.X	申请日：	2022-12-27
公开（公告）号：	CN115664981A	公开（公告）日：	2023-01-31
发明（设计）人：	高庆;蔡鑫江;吕金虎;刘昊;王振乾;王薇	申请（专利权）人：	北京航空航天大学
主分类号：	H04L41/14	分类号：	H04L41/14;H04L41/142
代理公司：	北京天汇航智知识产权代理事务所(普通合伙) 11987	代理人：	陈陈数
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向工业互联网博弈控制系统建模均衡求解方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向工业互联网的博弈控制系统建模与均衡求解方法，其特征在于，包括以下步骤：

步骤一、根据工业互联网实际背景对博弈控制系统进行建模，确定系统状态方程及各博弈参与者的代价函数；

步骤二、设计动态反馈均衡策略，重新确定系统状态方程与各博弈参与者的代价函数；

步骤三、根据各博弈参与者的代价函数，定义系统各博弈参与者在时刻k的累积代价函数；

步骤四、根据系统状态方程以及各博弈参与者的累积代价函数，迭代求解各时刻的最优动态反馈均衡策略。

2.根据权利要求1所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法，其特征在于，所述步骤一中，博弈控制系统的建模方式具体为：将工业互联网场景中服从上级调控的个体利益维护者抽象为博弈控制系统的跟随者，其个数为n，将以特定目的调控各跟随者的系统整体利益维护者抽象为博弈控制系统的领导者，其个数为m；

博弈控制系统的状态方程通过一阶差分方程进行描述：

其中表示系统状态，为第i个领导者的决策，为第j个跟随者的决策，表示时刻，A为描述系统当前时刻状态与下一时刻状态更新关系的给定矩阵，为描述第i个领导者决策对下一时刻系统状态影响关系的给定矩阵，为描述第j个跟随者决策对下一时刻系统状态影响关系的给定矩阵。

3.根据权利要求2所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法，其特征在于，所述步骤二中，动态反馈均衡策略的具体设计方法为：设计动态反馈：

其中描述第i个领导者的策略更新方式，描述第j个跟随者的策略更新方式；

对进行扩维，记；通过代数变换，得到新的系统状态方程如下：

其中

即为第i个参与者的动态反馈均衡策略，即为第j个跟随者的动态反馈均衡策略，表示p维单位矩阵。

4.根据权利要求3所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法，其特征在于，所述步骤三中，累积代价函数具体为：利用动态规划的思想，将第l个博弈参与者在时刻k采取策略，从时刻k+1直到终止时刻N一直采取最优策略付出的代价之和定义为累积代价函数；其中。

5.根据权利要求4所述的一种面向工业互联网的博弈控制系统建模与均衡求解方法，其特征在于，所述步骤四中，迭代求解各时刻的最优动态反馈均衡策略具体为：

S41、对时刻k和黎卡提矩阵进行初始化；

S42、将领导者的决策信息作为跟随者决策的参数，求解时刻k时各跟随者的最优反应策略；

S43、将S42中求出的跟随者的最优反应策略作为领导者策略求解过程中的约束条件，得到时刻k时领导者的最优动态反馈均衡策略；