[发明专利]一种MIMO智能反射面传输系统中的参数调整方法有效

专利信息
申请号: 202110735165.3 申请日: 2021-06-30
公开(公告)号: CN113472402B 公开(公告)日: 2022-08-02
发明(设计)人: 陈明;范鸣 申请(专利权)人: 东南大学
主分类号: H04B7/0413 分类号: H04B7/0413;H04B7/0456
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 孙建朋
地址: 211102 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 mimo 智能 反射 传输 系统 中的 参数 调整 方法
【权利要求书】:

1.一种MIMO智能反射面传输系统中的参数调整方法,其特征在于,包括以下步骤:

步骤A:建立总可达速率最大化模型,所述模型为:

约束条件:

其中,表示Fl,k的F范数的平方,Rl,k为第l个小区第k个用户的可达速率,Fl,k为第l个小区第k个用户的预编码矩阵,dl,k为第l个小区第k个用户的流数,Pl,max为第l个小区基站的最大发射功率,Nr为用户接收天线数,θm为智能反射面中第m个反射单元的反射角,L是小区数,K是小区中的用户数,M是智能反射面的反射单元数,θ=[θ1,…,θM]为θm构成的相移角,为所有用户构成的预编码矩阵,Rl,k表达如下:

其中表示矩阵Jl,k的逆,干扰协方差矩阵其中代表矩阵的共轭转置矩阵,σ2为信道噪声方差,为第n个小区基站到第l个小区第k个用户的等效信道矩阵且Hn,l,k为第n个小区的基站到第l个小区的第k个用户的信道矩阵,为第n个小区的基站到第l个小区的第k个用户的信道矩阵,为智能反射面到第l个小区的第k个用户的信道矩阵,为智能反射面的对角相移矩阵,表示对复数jθ1的以自然常数e为底的指数函数运算,diag{·}表示括号中元素构成的对角矩阵,log(·)表示以2为底的对数函数,det(·)表示矩阵的行列式,I表示单位矩阵;

步骤B:将所述总可达速率最大化模型转化为如下等价优化模型:

约束条件:

其中,Tr(·)表示矩阵的迹,总检测矩阵总权重矩阵Wl,k为第l个小区的第k个用户的权重矩阵,Ul,k为第l个小区的第k个用户的检测矩阵,El,k为均方误差矩阵,El,k表示如下:

步骤C:定义每一个小区的基站为一个智能体,智能体l对应第l个小区,智能体搜集当前状态信息sl,并将sl输入到当前值网络;所述当前值网络的输出神经元产生输出,比较输出神经元的输出值大小,若第i个输出神经元的输出最大,则依据下式计算第l个小区第k个用户的流数dl,k

其中,表示对括号中元素向下取整,所述当前值网络为深度神经网络DNN,汇总流数dl,k,得到所有用户的流数集合d;

步骤D:依据所述流数集合d,迭代求解得到预编码矩阵F和相移角θ;在第j+1次迭代中,求解过程如下:

步骤D-1:关于优化预编码矩阵F的模型为:

约束条件:

关于优化相移角θ的模型为:

约束条件:0≤θm≤2π,m=1,…,M

其中,中间矩阵V为

步骤D-2:将第j次迭代获得的θ,W和U代入到优化预编码矩阵F的模型,采用KKT条件求解预编码矩阵F,得到F;

步骤D-3:将步骤D-2求得的F和第j次迭代获得的W和U代入到优化相移角θ的模型,采用MM算法求解相移角θ,得到θ;

步骤D-4:利用步骤D-2和D-3求得的F和θ以及第j次迭代获得的W,依据下式计算Ul,k

进而得到U;

步骤D-5:利用步骤D-2到D-4求得的F、θ和U,依据计算Wl,k,进而得到W;

步骤D-6:将步骤D-2到D-5得到的F、θ、W和U代入并计算等价优化模型的目标函数中,当目标函数值变化量的绝对值小于给定门限时,迭代终止,输出F和θ,否则进行下一轮迭代;

步骤C中所述当前值网络需要训练,训练过程如下:

步骤C-1:智能体l与相邻小区集合Il进行信息交互,得到Il上一时刻的流数集合vl′=(di,k,i∈Il,k=1,…,K),并将其与第l个小区基站到第l个小区和相邻小区集合Il用户的信道矩阵,第l个小区基站到智能反射面和智能反射面到第l个小区用户信道矩阵构成向量组合,得到状态sl表示如下:

其中,第l个小区基站到第l个小区和相邻小区集合Il用户的信道实部构成的向量第l个小区基站到第l个小区和相邻小区集合Il用户的信道虚部构成的向量第l个小区基站到智能反射面的信道实部构成的向量第l个小区基站到智能反射面的信道虚部构成的向量智能反射面到第l个小区用户信道实部构成向量和智能反射面到第l个小区用户信道虚部构成向量分别表示如下:

其中,real(Hl,n,k)表示取矩阵Hl,n,k的实数部分构成新矩阵,imag(Hl,n,k)表示取矩阵Hl,n,k的虚数部分构成新矩阵,vec(A)表示将矩阵A中元素按行展开成行向量,随后将状态sl输入当前值网络,得到输出为当前值网络的参数;

步骤C-2:依据步骤C-1得到的输出,依据ε贪婪策略选取动作al,若所选取的动作al对应当前值网络输出的第i个神经元,则依据得到第l个小区第k个用户的流数;

步骤C-3:依据步骤C-2得到的流数,根据步骤D得到所对应的F和θ,并根据下式计算奖励rl(sl,al):

其中为第l小区的第k个用户在仅受到Il干扰下的可达速率,表示如下:

为Il中第n个小区的第m个用户不受到第l个小区干扰下的可达速率,表示如下:

其中{In\l}表示第n个小区的相邻小区集合中排除第l个小区;

步骤C-4:若智能体l下一时刻状态为s′l,智能体l将(sl,al,rl(sl,al),s′l)存入到经验池中;

步骤C-5:每经历J个状态后,智能体l从经验池中取出Nbatch个数据,将sl输入当前值网络,并结合动作al计算得到将s′l输入目标值网络,得到输出依据下式计算损失函数

依据采用反向传播算法更新计算其中目标值网络为DNN网络,网络结构与当前值网络相同,为目标值网络的参数,为从经验池中取出Nbatch个数据构成的集合,γ为折扣因子;al,i是动作空间中的第i个动作;

步骤C-6:更新的次数达到T后,将当前值网络参数赋值给目标值网络参数

步骤C-7:当损失函数值的变化量的绝对值小于给定门限时,训练结束,否则,继续根据步骤C-1到步骤C-6进行训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110735165.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top