[发明专利]一种高速移动场景下的动态多信道接入方法在审
申请号: | 201910312023.9 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110035478A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 吕铁军;王少阳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04W48/16 | 分类号: | H04W48/16;H04W48/18;H04W24/06;H04B17/391;H04B17/309 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 高速移动通信系统中,基于深度强化学习和长短时记忆单元的动态多信道接入方法操作步骤如下:(1)信道状态信息预测阶段:基于长短时记忆单元对信道增益进行预测,得到实时的信道增益预测信息。(2)多信道接入模型训练阶段:利用深度强化学习技术,结合步骤(1)中获取的预测信息,通过在线训练的方式,更新多信道接入模型的参数。(3)高速移动用户信道接入阶段:将用户需求的服务质量输入到多信道接入模型,即可输出信道选择策略。本发明方法在确保实时追踪信道动态变化的前提下,能够带来接近于穷搜的系统性能并降低了处理时延和削弱非即时处理误差的影响。本发明利用长短时记忆单元的高精度预测特性,提高了模型的收敛速度。 | ||
搜索关键词: | 多信道 记忆单元 强化学习 信道增益 预测信息 高速移动通信系统 高速移动场景 高速移动用户 信道状态信息 高精度预测 处理时延 即时处理 模型训练 实时追踪 输出信道 系统性能 信道动态 信道接入 选择策略 用户需求 在线训练 质量输入 预测 收敛 削弱 更新 服务 | ||
【主权项】:
1.基于深度强化学习和长短时记忆单元的动态多信道接入方法,用于下述场景:包括一个带有M个子信道的基站和N个高速移动用户的通信系统。当用户需要进行数据传输的时候,向基站发送请求接入的信号。其特征在于:所述方法包括下列三个操作步骤:(1)信道增益信息预测阶段:构建基于长短时记忆单元的时序预测模型,然后实时采集信道增益的变化信息,构建信道增益时序序列。通过在线训练的方式更新模型的参数并在需要的时隙输出信道增益的预测信息。(2)多信道接入模型训练阶段:利用重新设计的基于预测的深度确定性策略梯度的深度强化学习算法,构建多信道接入模型的网络结构,并在线训练,实时更新。在有接入请求时,停止训练,输出策略,其余时刻则不间断地持续训练。(3)高速移动用户信道接入阶段:当有用户请求接入或每隔L(L≥1)个时隙,将用户需求的服务质量信息,当前时隙的信道增益信息和预测的信道增益信息输入网络,输出多信道接入策略,然后用户依据该多信道接入策略,进行接入。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910312023.9/,转载请声明来源钻瓜专利网。