[发明专利]无线通信接收窗口预测方法、装置及无线通信设备有效
申请号: | 201911367541.7 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111130698B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 高迎宾;郑允军;夏玮玮;燕锋;张亦农;沈连丰 | 申请(专利权)人: | 南京中感微电子有限公司 |
主分类号: | H04L1/00 | 分类号: | H04L1/00;H04W52/02 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 苗苗 |
地址: | 210032 江苏省南京市高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无线通信 接收 窗口 预测 方法 装置 设备 | ||
1.一种无线通信接收窗口预测方法,其特征在于:其具有训练模式和利用模式,
在所述训练模式下时,包括如下步骤,
获取全局信息,所述全局信息包括当前状态信息和当前时隙中采取的接收动作是否正确的信息,
基于所述全局信息,进行深度强化学习训练,获得最优接收策略,
以所述最优接收策略更新当前接收策略;
在所述利用模式下时,包括如下步骤,
获取当前状态信息,
根据所述当前状态信息,并基于深度强化学习训练获得的当前接收策略,生成接收控制信号,以决定在当前时隙下是否执行数据接收动作,
所述当前状态信息表示当前时隙为最近一次接收数据包完成之后的第几个接收时隙。
2.根据权利要求1所述的无线通信接收窗口预测方法,其特征在于:采用深度强化学习技术获得当前接收策略或最优接收策略,其中,
根据由状态信息构成的状态空间,无线通信设备执行的接收数据的动作构成的动作空间,状态转移规则函数和奖励函数,采用预定的决策过程建模,并执行强化学习任务,产生动作策略,并根据多步折扣累积奖励迭代更新所述动作策略,直至收敛获得最优接收策略或当前接收策略;
其中,所述接收策略为接收动作在状态空间的概率分布。
3.根据权利要求2所述的无线通信接收窗口预测方法,其特征在于:在利用模式下,选择是否进行接收的具体方法为:
生成[0,1)区间均匀分布的随机数并与当前状态下执行接收动作的接收概率进行比较,当所述随机数小于或等于所述接收概率时选择接收,否则不选择接收。
4.根据权利要求2所述的无线通信接收窗口预测方法,其特征在于:在所述训练模式下时,所述深度强化学习训练的结果达到收敛时,获得最优接收策略,训练模式结束,切换到利用模式;
在所述利用模式下时,若数据的接收未满足可靠性要求,则切换到训练模式。
5.根据权利要求4所述的无线通信接收窗口预测方法,其特征在于:所述数据接收未满足可靠性要求包括,数据接收出现漏包或丢包率大于设定阈值。
6.根据权利要求2所述的无线通信接收窗口预测方法,其特征在于:当接收动作在状态空间的概率分布在状态p取得峰值时,将所述峰值状态p及其前后连续的k个状态置为强制接收状态,执行数据接收动作,其中k为正整数。
7.根据权利要求1至6中之一所述的无线通信接收窗口预测方法,其特征在于:在所述利用模式下,在接收到来自发送端的数据包后,将随后连续的m个状态置为强制接收状态,持续执行数据接收动作,其中m为正整数。
8.根据权利要求7所述的无线通信接收窗口预测方法,其特征在于:在所述利用模式下,若收到的数据包未通过CRC循环冗余校验或者不完整,则持续执行数据接收动作,直至收到的数据包通过CRC校验且无包头错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中感微电子有限公司,未经南京中感微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911367541.7/1.html,转载请声明来源钻瓜专利网。