[发明专利]一种多智能体系统分布式优化控制方法及存储介质有效
申请号: | 202110982285.3 | 申请日: | 2021-08-25 |
公开(公告)号: | CN113722653B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 姜晓伟;曹爽;张斌;李刚 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F17/10 | 分类号: | G06F17/10;G06F17/16;G06F17/15 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 万文广 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 体系 分布式 优化 控制 方法 存储 介质 | ||
1.一种多智能体系统分布式优化控制方法,其特征在于,包括:
初始化所述多智能体系统的本地状态量;
初始化后的所述多智能体系统中的智能体迭代更新本地变量信息,迭代更新规则为:
其中,k代表迭代次数,为函数fi(xi)取得最小值时状态值xi的取值,为第k次迭代时智能体i的本地数据原始变量信息,且i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,表示智能体对自身设置的惩罚项系数,为第k-1次迭代时的对偶变量,通过迭代更新得到状态值xi;
迭代过程中,根据不同的所述智能体之间原始变量的误差,利用第一公式更新所述惩罚项系数,所述第一公式为:
其中,kmax2为惩罚项最大更新次数,惩罚函数变量c0为惩罚项初始设定值,为智能体i对自身设置的惩罚项系数,为智能体i对邻居j设置的惩罚项系数,为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数,且其中,为第k次迭代时智能体i的误差函数值,为第k次迭代时智能体j的误差函数值,为第k次迭代时智能体j的本地数据原始变量信息;
在迭代过程中,根据原始变量状态值,利用第二公式更新门限函数,所述第二公式为:
其中为智能体i第k-1次的通信变量,用于记录通信后本地的原始变量值,τk是人为设定的随更新次数递减的序列,kmaxl为通信门限函数的最大更新次数;
根据所述门限函数,确认所述智能体是否能通信,若能通信,则所述智能体间交换信息,且更新其中为智能体i存储的通信变量,若智能体不能通信,则更新
利用第三公式迭代更新所述对偶变量,所述第三公式为:
其中,为第k次迭代时的对偶变量,为第k次迭代时对自身设置的惩罚项,为第k次迭代时对邻居j设置的惩罚项;
智能体迭代更新本地变量信息时,同步判断所述多智能体系统的更新误差是否满足预设条件,若满足所述预设条件,则完成迭代过程,若不满足所述预设条件,则多智能体系统重新按照所述迭代更新规则迭代更新,直至满足所述预设条件并结束迭代。
2.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述更新误差表达为第四公式:
其中,Xk为第k次迭代时矩阵形式的状态量,X0为多智能体系统初始状态值矩阵,Xk-1为第k-1次更新系统的状态值矩阵,C(k)为更新误差值,||||F表示矩阵的Frobenius范数。
3.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述多智能体系统分布式优化控制方法还包括:
设置衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数,所述误差函数为:
其中,为衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数值,表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最大值,表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最小值。
4.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述预设条件为所述多智能体系统的更新误差的值小于10-8。
5.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述根据原始变量状态值,利用第二公式更新门限函数包括:
当门限函数更新次数超过kmax1次时,设置门限函数为0,此时门限函数作用消失,在每次迭代过程中所述智能体间均进行通信。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110982285.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铝合金关节连接器组装机
- 下一篇:用于极片卷绕的自动换卷装置