[发明专利]一种基于两阶段优化的多智能体网络自适应信息共享方法在审
申请号: | 202010801936.X | 申请日: | 2020-08-11 |
公开(公告)号: | CN112070359A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 杨凤;王小妮 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06N20/00 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 麻吉凤 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 优化 智能 网络 自适应 信息 共享 方法 | ||
1.一种基于两阶段优化的多智能体网络自适应信息共享方法,其特征在于,包括:
S1、分析并计算网络某任务下网络拓扑结构、智能体拥有的资源和信息需求程度因素;
S2、局部优化:根据所述网络拓扑结构、智能体拥有的资源和信息需求程度的计算结果,选择第一优化算法,获取每个智能体与其邻域之间的最优信息共享模式;
S3、全局优化:利用第二优化算法调整各智能体的信息共享模式,获取与当前任务相对应的整个网络的优化信息共享模式。
2.根据权利要求1所述的方法,其特征在于,所述S2包括:
所述第一优化算法的输入为TSi、Mi、IDi,、Si、Nei(i)、α、β,输出为Ri、Xi,其中,TSi是指智能体i的资源总量;Mi是指智能体i的信息总量;IDi是指智能体i的邻居对其所拥有的信息的需求程度,智能体i的邻居k对信息j的需求是IDijk;Si是指i与邻居实现信息共享所需的资源,i与邻居k共享信息j所需的资源是Sijk;Nei(i)是指i的邻居;Ri为矩阵,大小为M×P,表示与邻居共享信息后对智能体i的奖励,与邻居k共享信息j的奖励为Rijk,Rijk=α*ID3ijk+β,α,β表示多项式的参数;Xi代表智能体i的信息共享模式,Xijk为0或1,1表示与邻居k共享的智能体信息j,0表示不共享;TSi是一个数,TSi≥0,Mi、IDi、Si、Nei(i)、Ri、Xi都是大小分别为1×M、M×P、M×P、1×P、M×P、M×P的矩阵,其中M表示智能体i拥有的信息数,P表示智能体i的邻居数,目标函数是:
Rewardi=Max(Sum(Ri*Xi)) s.t.Sum(Si*Xi)=TSi
Mi、IDi、Si、Ri和Xi都是根据共享后所拥有的信息的变化实时变化的;
Rewardi是邻居之间共享信息的总奖励,当Rewardi0时,共享信息是有意义的,如果ECi1,则当Rewardi为最大值时,Xi是所需的信息共享模式;
其中,Cs和Es分别表示共享信息条件下的成本和效益,C和E分别表示不共享信息条件下的成本和效益,成本和效益根据实际情况确定;ECi评估了提高效益和增加成本的相对程度,当ECi1时,即效益高于成本,选择共享信息,相反,不共享信息;
实现对每个智能体的操作,更新网络的状态,经过一组迭代,最终确定每个智能体拥有的信息在整个网络中初步的共享范围和模式。
3.根据权利要求2所述的方法,其特征在于,所述S3包括:
使用ln函数进行标准化处理,在一定任务t下,目标函数为:
其中,IV(t)为任务t下整个网络信息共享模式效率的评估,目标是找到IV(t)的最大值;N为多智能体网络中智能体的数量;
θ(x)为权重函数:
θ(x)=1,x>0;θ(x)=0,x≤0
Rewardi的值根据以下规则确定:
θ(Rewardi)=1,Rewardi>0;θ(Rewardi)=0,Rewardi≤0
ECi的值根据以下规则确定:
θ(ECi-1)=1,ECi>1;θ(ECi-1)=0,ECi≤1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010801936.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冷拔灯杆的制备工艺及所制得的灯杆
- 下一篇:一种高压雪崩晶体管
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理