[发明专利]一种快速收敛的最优信道选择方法有效
申请号: | 202010534314.5 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111711931B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 陈春梅;杨世恩;蒋和松 | 申请(专利权)人: | 西南科技大学 |
主分类号: | H04W4/38 | 分类号: | H04W4/38;H04W28/02;H04W84/18;H04L25/02 |
代理公司: | 成都时誉知识产权代理事务所(普通合伙) 51250 | 代理人: | 何悦 |
地址: | 621000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 收敛 最优 信道 选择 方法 | ||
本发明公开了一种快速收敛的最优信道选择方法,涉及认知无线电技术领域,包括以下步骤:首先建立基于G‑E马尔可夫信道的状态转移模型,根据该模型得到每个时隙下的信道状态;然后将最优信道的选择问题定义为机器学习中的MAB问题,将每个信道视为MAB中的一个臂,根据每个臂的收益回报值的不同,统计出当前最优信道。在接下来的迭代学习过程中,创新地加入了基于状态统计的信道置信因子以及E‑E平衡系数,由此计算出最大置信上界g′去更新各个臂的收益回报;循环往复,直到收敛到最优信道,本发明能够解决多个感知信道共存时系统的快速收敛和精确信道选择问题。
技术领域
本发明涉及认知无线电技术领域,具体为一种快速收敛的最优信道选择方法。
背景技术
随着无线通信业务的快速发展,无线传感网络得到了广泛应用,如智能家居、智慧城市、环境监测等领域。无线传感网络由大量的微传感器节点组成,其间使用开放频段进行通信,如ISM(Industrial Scientific Medical)频段。然而,随着开放设备不断增加,网络严重拥塞,通信的可靠性难以得到保障,从而严重影响无线传感网络的持续发展,在多个认知无线信道共存的情况下,准确快速地收敛到最优信道是认知无线传感器网络(CognitiveRadio Sensor Network,CRSN)面临的一个挑战,传统的无线信道选择方法可以实现最优信道选择问题。但由于计算量大、时间积累大,其收敛速度达不到要求。
发明内容
本发明的目的在于克服现有技术的不足,提供一种快速收敛的最优信道选择方法。
本发明的目的是通过以下技术方案来实现的:
一种快速收敛的最优信道选择方法,包括以下步骤;
S1,建立基于G-E马尔可夫信道的状态转移模型,为每个信道的每个时隙生成G-E信道状态,将每个信道定义为一个臂,
S2,对每个臂访问一次,获得每个臂的初始奖励值;
S3,选择当前最优臂并计算其平均收益;
S4,采用基于状态统计信息而构建的新的g’去更新最佳臂的置信上界;
S5,重复步骤S2,S3与S4,直到收敛到最优信道。
优选的,所述步骤S1中的G-E马尔可夫信道的状态有两种,忙用0表示和闲用1表示,有限状态空间可以定义为S={0,1}。
优选的,所述状态转移模型中的授权信道状态转移概率矩阵以及状态分布表示为:
其中,λ0和λ1是信道信念值的边界,信道是正相关,即λ0≤λ1,基于G-E马尔可夫特性,系统的下一个状态可基于当前状态由转移概率计算得出。
优选的,所述步骤S2中的最优臂的平均收益通过以下公式计算:设在n个时隙之后,选择了第i个信道Ti(n)次。那么初始奖励值的平均值可以表示为:
其中,χi(t)是时隙t处选择信道i获得的实际回报。
优选的,所述
当信道状态为忙时,传输将失败,则系统回报为Rc<0的惩罚,当信道状态为空闲时,传输将成功,并给予Rr>0的奖励回报。
优选的,所述步骤S4包括以下子步骤:
S4.1,根据初始奖励值的平均值计算公式,通过UCB1策略可得期望的置信上界UCBi(n):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010534314.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种板件支撑机构及钣金折弯机
- 下一篇:一种腐植酸尿素复合肥及制备方法