[发明专利]一种多智能体同步控制方法、设备及存储设备有效
申请号: | 201910731427.1 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110554604B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 陈鑫;符浩 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 万文广 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 同步 控制 方法 设备 存储 | ||
1.一种多智能体同步控制方法,应用于多智能体同步控制系统中;所述一种多智能体同步控制系统包括:多个跟随者智能体和一个领导者智能体;其特征在于:所述一种多智能体同步控制方法,具体包括以下步骤:
S101:构建观测网络对领导者智能体的动力学模型进行实时估计,得到各跟随者智能体对领导者智能体的动力学模型的估计;
步骤S101中,采用BP神经网络构建观测网络,逼近领导者智能体动力学模型;具体公式如公式(1)所示:
上式中,表示跟随者智能体i在t时刻对领导者智能体的动力学模型的估计;表示跟随者智能体i在t时刻对领导者智能体状态的估计,且的初始值为预设值表示观测网络t时刻的隐藏层到输出层的权值,且wb1(t)~wbN(t)均相等,N为跟随者智能体的总个数,且wbi(t)的初始值为预设值wbi(0);表示观测网络的输入层到隐藏层的权值,为预设值;σbi(·)表示观测网络的激活函数,采用Hyperbolic Tangent函数,n为各跟随者智能体跟随领导者智能体同步运动的实际状态维数,hbi为观测网络的隐藏层个数,根据实际情况预设;
S102:根据所述观测网络和所述多智能体同步控制系统的实际有向通信拓扑网络结构,构建神经网络自适应分布式状态观测器,以对领导者智能体的状态进行实时估计,得到各跟随者智能体对领导者智能体状态的估计;
步骤S102中,构建的神经网络自适应分布式状态观测器具体如公式(2)所示:
上式中,为跟随者智能体i在t+1时刻对领导者智能体状态的估计;为跟随者智能体i在上一时刻,即t时刻对领导者智能体的动力学模型的估计;表示跟随者智能体i在t时刻的局部领域观测估计误差,为摄动信号;aij为所述多智能体同步控制系统的实际有向通信拓扑网络结构的邻接矩阵参数,bi为所述多智能体同步控制系统的实际有向通信拓扑网络结构中领导者智能体通向智能体i的权重参数;i=1,2,…,N,N表示跟随者智能体总个数,k1,i∈Rn×n表示所述多智能体同步控制系统的实际有向通信拓扑网络结构中智能体i的增益,为预设值;x0(t)为领导者智能体在t时刻的实际状态;
S103:根据所述神经网络自适应分布式状态观测器,针对各跟随者智能体分别构建执行网络和评价网络,并根据各跟随者智能体的执行网络得到各跟随者智能体的最优控制输入;
步骤S103中,采用BP神经网络逼近理想执行网络的输出,执行网络的具体公式如公式(3)所示:
上式中,ui(t)表示执行网络的输出,即跟随者智能体i在t时刻的最优控制输入,为跟随者智能体i的执行网络在t时刻的输入;xi(t)为跟随者智能体i在t时刻的实际状态;表示跟随者智能体i的执行网络在t时刻隐藏层到输出层的权值;表示跟随者智能体i的执行网络的输入层到隐藏层的权值,为预设值,σai(·)表示执行网络的激活函数,采用Hyperbolic Tangent函数;hai为隐藏层个数,为预设值;
S104:采用观测网络的权值更新率对观测网络隐藏层到输出层的权值进行更新,采用执行网络的权值更新率对执行网络隐藏层到输出层的权值进行更新,采用评价网络的权值更新率对评价网络隐藏层到输出层的权值进行更新;
S105:根据各跟随者智能体的最优控制输入对各跟随者智能体分别进行控制,得到各跟随者智能体的系统状态,进而返回步骤S101,以进行下一时刻的多智能体同步控制;如此循环迭代,以实现多智能体的同步控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910731427.1/1.html,转载请声明来源钻瓜专利网。