[发明专利]基于对数线性算法的通信对抗中用频决策优化方法有效
申请号: | 202010534345.0 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111726192B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 戚楠;王伟;黄赞奇;吴启晖;王梅;李宵杰;严勇杰;胡雨昕;尹真 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | H04K3/00 | 分类号: | H04K3/00;G06N20/00 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 陈月菊 |
地址: | 211016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对数 线性 算法 通信 对抗 中用 决策 优化 方法 | ||
1.一种基于对数线性算法的通信对抗中用频决策优化方法,其特征在于,所述优化方法包括:
S1,构建敌我双方用户通信场景,将相互独立的我方用户和敌方用户设定为博弈双方,敌我双方依次进行用频决策过程,在每轮对抗过程中,都能通过推测/感知对方用频情况作为己方用频决策的参考;其中我方用户包括N个通信收发对和一个干扰机,敌方用户包括M个通信收发对;
S2,以通过推测/感知当前频谱环境调整己方选频策略以最大化其自身的效用为原则,将敌我双方用户的干扰对抗问题表述为Stackelberg博弈过程,构建博弈模型;对于我方用户,博弈模型的目的是将我方用户之间互扰降到最低和最大化我方干扰机对敌方用户的干扰,对于敌方用户,博弈模型的目的是将敌方用户之间互扰降到最低和最小化我方干扰机对己方的干扰;
S3,证明所构建博弈模型为精确势能博弈;
S4,设计基于对数线性学习分布式信道选择算法,所述算法用于敌方用户和我方用户的用频决策,以求得所建博弈问题均衡解;
S5,对步骤S4中设计的算法进行收敛性证明;
步骤S1中,所述构建敌我双方用户通信场景的过程包括:
S11,设我方用户包括N个通信收发对和一个干扰机,敌方用户包括M个通信收发对,其中表示我方一共N+1个用户的编号集合,表示我方N个通信收发对集合,编号为N+1的我方用户表示的是我方干扰机;表示敌方M个通信收发对集合,用户瞬时信道增益表达式为其中dx,y表示用户x与用户y之间的距离,α和分别代表路径衰落系数和瑞利衰落系数;an表示我方通信对n的用频策略;
S12,敌我双方依次进行用频决策过程,其中敌方作为弱势方首先进行决策,我方作为强势方进行最终决策,在每轮对抗过程中,都能通过推测或感知对方用频情况作为己方用频决策的参考;
步骤S2中,所述以通过推测/感知当前频谱环境调整己方选频策略以最大化其自身的效用为原则,将敌我双方用户的干扰对抗问题表述为Stackelberg博弈过程,构建博弈模型的过程包括以下步骤:
S21,将敌我双方用户通信对抗中用频决策Stackelberg博弈定义为:其中和分别代表我方用户与敌方用户集合,表示我方和敌方各自的可选信道集,un和um分别代表我方用户n与敌方用户m的效用函数;
S22,对于我方用户,将我方用户子博弈定义为:式中,an、a-n和am分别代表我方用户n、除用户n以外其他我方用户和敌方用户m的用频策略;
S23,对于我方用户n,其目的是将我方用户之间互扰降到最低和最大化我方干扰机对敌方用户的干扰,其效用un定义为:
其中Lu和Lj是预定的正常数,防止目标效用值小于零,Pn和PN+1分别表示我方用户n与我方干扰机的发射功率,和分别代表我方用户之间的瞬时信道增益、我方通信对与我方干扰机之间的瞬时增益和我方干扰机与敌方通信对之间的瞬时信道增益;Zb和Zr分别表示我方干扰机的天线旁瓣对我方通信对造成干扰的程度与我方干扰机的天线主瓣对敌方用户造成干扰的程度,并且ZbZr;f(ax,ay)表示的是选频结果是否相同的指示函数,其表达式为:Ps是我方通信对s的发射功率,as是我方通信对s的用频策略,表示我方除通信对n外的其他通信对,aN+1是我方干扰机的用频策略,是我方干扰机与我方通信对s之间的瞬时信道增益,ax是通信对x的用频策略,ay是通信对y的用频策略,ax,ay用于判断任意两个用户x和y之间的相对关系;
S24,定义所建立的我方用户子博弈模型的目标为最大化每个用户的效用函数,即
S25,对于敌方用户,将敌方用户子博弈定义为:am、a-m分别代表敌方用户m、除用户m以外其他敌方用户的用频策略;
S26,对于敌方用户m,其目的是将敌方用户之间互扰降到最低和最小化我方干扰机对己方的干扰,其效用um定义为:
其中Lu是一个预定的正常数,防止目标效用值小于零,Pm和PN+1分别表示敌方用户m与我方干扰机的发射功率;aN+1是我方干扰机的用频策略;Pi是敌方通信对i的发射功率,ai是敌方通信对i的用频策略,表示敌方除通信对m外的其他通信对,是敌方通信对i与敌方通信对m之间的瞬时信道增益,是我方干扰机与敌方通信对m之间的瞬时信道增益;
S27,定义所建立的敌方用户子博弈模型的目标为最大化每个敌方用户的效用函数,即
步骤S3中,所述证明所构建博弈模型为精确势能博弈的过程包括以下步骤:
S31,在敌方用户子博弈中,对于敌方用户m的用频策略am,定义势能函数φl:
φl=φl,1+φl,2
当敌方用户m单方面将用频策略am改变成计算对应的势能函数的变化是否与效用函数的变化相同,如果相同,所构建的博弈模型是一个精确势能博弈;
S32,在我方用户子博弈中,对于我方用户n的用频策略an,定义势能函数φf:
φf=φf,1+φf,2
其中φf,1和φf,2中的h(n,N+1),y(n,N+1)以及g(n,N+1)的定义为:
是我方干扰机与敌方通信对m之间的瞬时信道增益,是我方用户对n与敌方通信对m之间的瞬时信道增益;
当我方用户n的单方面将用频策略an改变成计算对应的势能函数的变化是否与效用函数的变化相同,如果相同,所构建的博弈模型是一个精确势能博弈;
步骤S4中,所述设计基于对数线性学习分布式信道选择算法的过程包括以下步骤:
S41,初始化:令迭代次数k=1,用户集根据其通信需求从其可用信道集中等概率的选择信道组合An={a1,a2,...,an,...,aN+1},a1是我方用户对1的用频策略,a2是我方用户对2的用频策略;
S42,用户集从其可用信道集中随机选择一个信道组合并计算其在信道组合的情况下的总体效用Lu是预定的正常数,防止目标效用值小于零;Un是我方用户对n的效用,UN+1是我方干扰机的效用,LN+1是保证我方干扰机效用为正数的常数;
S43,用户集根据如下规则更新其信道选择概率:
其中β为学习参数,c(k)是迭代第k代的信道组合;U(c(k))是信道组合为c(k)时,我方的总体效用;
S44,令k=k+1,循环步骤S42和S43,直到达到k达到最大迭代次数或网络效用变化值小于设定变化阈值,跳出循环;
步骤S5中,所述对步骤S4中设计的算法进行收敛性证明的过程包括以下步骤:
S51,将信道选择概率公式转化为:
S52,设定β的取值,其中β为正数,具体取值由环境参数而定,如果随机选择的信道组合的效用小于上一次的信道组合c(k)的效用,即远小于1且接近于0,此时c(k+1)等于c(k)概率接近1,选择随机选择的信道组合的概率接近0;如果随机选择的效用值比上一次的值大,则更偏向于随机选择;
S52,经过不断迭代学习,优化β的取值,并依概率做出效用值较大的用频决策,此时效用结果收敛到最大值。
2.根据权利要求1所述的基于对数线性算法的通信对抗中用频决策优化方法,其特征在于,敌我双方按如下步骤进行选频过程:
S121,我方用户随机选频;
S122,敌方用户根据感知的前一次我方干扰机的用频策略,决策出此次敌方用户的选频策略;
S123,我方用户根据推测的敌方用户的用频策略,决策出此次我方用户的选频策略;
S124,循环步骤S122和步骤S123直至对抗结束,每循环一次为一轮对抗过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010534345.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速清洗茅草根的设备
- 下一篇:低温油炸脱水设备