[发明专利]一种基于强化学习的地图辅助车联网抗干扰通信方法有效
申请号: | 202210479398.6 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114826449B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 肖亮;林志平;颜晓豪;唐余亮;杨和林;邱际光 | 申请(专利权)人: | 厦门大学 |
主分类号: | H04B17/309 | 分类号: | H04B17/309;H04B17/336;H04B17/345;H04B17/327;H04W4/46 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 地图 辅助 联网 抗干扰 通信 方法 | ||
1.一种基于强化学习的地图辅助车联网抗干扰通信方法,其特征在于包括以下步骤:
步骤1:车联网无线通信设备的可用发射功率和信道个数分别记为N和C,记发射功率可选信道X={[iPmax/N,]}1≤i≤N,1≤j≤C;
步骤2:构建神经网络A和网络B,其网络参数分别记为ω1和ω2;初始化信干噪比γ(0),误码率ρ(0),接收功率探索率ε=εmax;
步骤3:获取实时地图Γ得到遮挡物的位置和尺寸信息;
步骤4:在第k时隙,从路边站渠道获得车辆位置Y(k)、当前车辆密度n(k),通过信道估计算法获得到与路边站的信道状态h(k),根据车辆位置Y(k)计算与路边站间的距离D(k),根据实时地图Γ和车辆位置Y(k)判断信道类型κ(k),其中信道类型分为视距通信链路κ(k)=1和非视距通信链路κ(k)=-1;
步骤5:构建当前的状态向量
步骤6:将状态向量s(k)输入神经网络A,得到状态-动作对的估计值Q(s(k),x(k));以1-ε的概率选择具有最大Qi值的发射功率和信道以的概率随机选择任意的发射功率和信道;发送车辆在信道上以功率发送数据包给路边站;
步骤7:令路边站测量收到的信号功率统计前M个数据包的误码率ρ(k),并量化为L阶,估计信干噪比γ(k),形成反馈信息通过控制信道途径反馈给车载无线设备;
步骤8:估计当前的能耗E(k),计算:
其中,是指示函数:当变量为真则取值1,否则为0;
步骤9:将历史抗干扰经验e(k)={s(k),x(k),u(k)}存入缓存池H中,经过Z个时隙,从缓存池H中随机地取出一个历史经验e(i),并将状态向量s(i)输入神经网络B,记神经网络B的输出为
步骤10:采用随机梯度下降算法更新神经网络A的权重参数即
且每间隔c个时隙,令
步骤11:判断信道类型κ(k)是否等于-κ(k-1),当κ(k)=-κ(k-1)时,则探索率ε=εmax;
步骤12:判断探索率ε是否大于εmin,若是,则ε=ε-ε0;
步骤13:重复步骤3-12,直到满足|Q(s(k+1),x(k+1))-Q(s(k),x(k))|<0.01,即算法收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210479398.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有滑轨的包装箱
- 下一篇:一种主减速器的壳体总成、主减速器和车辆