[发明专利]一种基于合作抗干扰分层博弈模型的抗干扰学习方法有效
申请号: | 201810396863.3 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108616916B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 王金龙;陈瑾;张玉立;任国春;徐煜华;孔利君;李文 | 申请(专利权)人: | 中国人民解放军陆军工程大学 |
主分类号: | H04W24/06 | 分类号: | H04W24/06;H04W52/24;H04W72/08;H04B17/391 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 合作 抗干扰 分层 博弈 模型 学习方法 | ||
1.一种基于合作抗干扰分层博弈模型的抗干扰学习方法,其特征在于,包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,博弈的参与者是系统内的所有用户和干扰;
步骤2,所有用户随机生成初始的抗干扰策略,包括信道选择与功率配置,干扰则根据用户的抗干扰策略进行干扰信道选择,定义干扰的效用函数为系统通信用户策略保持不变时干扰存在与否对系统整体吞吐量的影响,定义用户的效用函数为干扰条件下的全网吞吐量与自身的功率消耗开销,引入势能博弈模型;
步骤3,随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略;
步骤4,循环步骤3,用户通过探索学习进行策略选择,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数;
步骤1所述的将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,该博弈模型定义为:
G=[{N,J},{A,aj},{un,uj}]
该博弈模型G中包含三个组成部分,其中,{N,J}为参与博弈的用户和干扰集合,{A,aj}为用户的策略空间和干扰的策略空间,{un,uj}为用户n的效用函数和干扰j的效用函数;
步骤2所述的引入势能博弈模型,具体如下:
定义用户间势能函数为:
在干扰存在条件下,领导者的博弈模型构成一个势能博弈,至少存在一个纯策略纳什均衡解;由于干扰始终存在且优化其干扰效用,所以Stackelberg博弈模型也存在相应的Stackelberg均衡解;βi是用户i的功率消耗单位代价,cn1、cn2为用户n的信道策略,为对应信道的功率配置;
步骤3所述的随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略,具体如下:
设定系统中共有M信道和N个用户,所有用户随机分布于某个区域内,用户n的发送端到用户m的接收端距离为dnm,用户n的策略为其中cn1、cn2为用户的信道选择,为对应信道配置的功率,则用户n在信道cn1上受到的干扰为:
其中α为信道衰落系数,若cxk=cni,则δ(cxk,cni)=1,表明用户该信道被干扰,反之δ(cxk,cni)=0,即用户没有收到干扰;
根据Shannon公式进行计算,得用户n在信道cn1上的吞吐量为:
其中,an为用户n的信道接入和功率配置策略,a-n为其余用户的策略,aj为干扰的干扰策略;rn为用户n的吞吐量,N0为噪声功率,α为信道衰落系数,1-δ(cni,aj)来表明该信道有没有收到干扰;
其中干扰的策略为aj,干扰的效用函数为:
其中,aN为全体用户的策略集合,aj=0表明干扰不对任何信道进行干扰;上式物理意义为施加干扰时,全系统吞吐量降低的性能即为干扰的效用;
在干扰条件下,用户的效用函数un为:
其中,βn为功率消耗代价;
博弈的优化目标:用户和干扰分别以自身效用函数为优化目标,即用户通过调整抗干扰策略,综合优化系统吞吐量和自身功率开销,干扰则通过选择信道进行干扰策略更新,使得干扰效用函数最大化:
即用户和干扰通过分别调整策略,使得自己的效用函数最大化。
2.根据权利要求1所述的基于合作抗干扰分层博弈模型的抗干扰学习方法,其特征在于,步骤4所述的循环步骤3,用户通过探索学习进行合作抗干扰,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数,具体如下:
(4.1)所有的用户进行信息交互;
(4.2)每次迭代都随机选择一个用户n进行操作;
(4.3)其他所有的用户重复之前的抗干扰策略选择,即a-n(k+1)=a-n(k);
对于选中的次级用户n,首先计算它选择不同抗干扰策略的效用函数值,用户n根据如下抗干扰策略更新准则进行抗干扰策略更新,即当新生成的策略能够带来更高的效用函数收益时,采用新生成的策略,an(k)表示用户n在第k时刻的策略;
干扰的策略更新规则为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学,未经中国人民解放军陆军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810396863.3/1.html,转载请声明来源钻瓜专利网。