[发明专利]一种超密集网络中基于强化学习的资源分配方法及装置有效
申请号: | 201910409339.X | 申请日: | 2019-05-17 |
公开(公告)号: | CN110191489B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 张海君;李东;任冶冰;刘玮;董江波;姜春晓;皇甫伟;隆克平 | 申请(专利权)人: | 北京科技大学 |
主分类号: | H04W28/08 | 分类号: | H04W28/08;H04W52/26;H04W52/40 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 密集 网络 基于 强化 学习 资源 分配 方法 装置 | ||
本发明提供一种超密集网络中基于强化学习的资源分配方法及装置,能够实现网络的负载均衡,并提高网络的能量效率。所述方法包括:基于Q学习对网络的当前状态进行分析,得到使网络能量效率最大时的用户与基站的关联策略和基站的发射功率控制策略;根据得到的使网络能量效率最大时的用户与基站的关联策略进行用户与基站的关联;在用户与基站关联的基础上,根据得到的使网络能量效率最大时的基站的发射功率控制策略对网络中基站的发射功率进行控制。本发明涉及通信技术领域。
技术领域
本发明涉及通信技术领域,特别是指一种超密集网络中基于强化学习的资源分配方法及装置。
背景技术
随着移动终端的快速发展,对网络容量的需求急剧增加。部署大量小型基站,例如毫微微小区基站(BS),微小区BS和微微小区BS可以增强网络容量。超密集网络是第五代移动通信中的一种新型网络架构,能够缩短用户与低功率基站之间的距离,提高系统容量和频谱效率。当网络架构从传统架构转向超密集网络时,也面临着诸多新的挑战,例如网络设计、资源分配和用户关联。
超密集网络中用户与低功率基站分布都十分密集,资源管理是保证其系统性能的重要因素。在传统网络中,用户关联通常基于最大信噪比实现,然而,基于最大信噪比的方法在超密集网络中可能不像传统网络那样有效。如果在超密集网络中采用该方法,则连接到用户的基站的优先级往往是高功率宏基站,这将容易导致宏基站过载并将其有限资源划分给多个用户,同时会导致小型基站的利用率低下。移动负载均衡技术可以及时有效地解决超密集网络中小区间业务量不均衡的情况,在多个小区之间平衡负载量,使未过载的邻居小区能够分担过载小区的业务负载量,平衡小区间负载,从而提高资源的利用率和用户的满意度。因此针对用户与基站的负载均衡的关联技术研究有重要意义。
目前,将强化学习应用于超密集网络的资源分配的研究很少,现有研究大多针对一个小基站对一个用户的场景,无法满足超密集网络中密集连接的情况。
发明内容
本发明要解决的技术问题是提供一种超密集网络中基于强化学习的资源分配方法及装置,以解决现有技术所存在的强化学习无法满足超密集网络中密集连接的问题。
为解决上述技术问题,本发明实施例提供一种超密集网络中基于强化学习的资源分配方法,包括:
基于Q学习对网络的当前状态进行分析,得到使网络能量效率最大时的用户与基站的关联策略和基站的发射功率控制策略;
根据得到的使网络能量效率最大时的用户与基站的关联策略进行用户与基站的关联;
在用户与基站关联的基础上,根据得到的使网络能量效率最大时的基站的发射功率控制策略对网络中基站的发射功率进行控制。
进一步地,所述基于Q学习对网络的当前状态进行分析包括:
A1,初始化Q学习算法的Q表,其中,Q表用于存储每个网络状态所采取动作的经验值,所述动作包括:用户与基站的关联策略和基站的发射功率控制策略;
A2,在当前网络状态下随机采取一个动作,并计算在当前网络状态下采取该动作后的系统能量效率;
A3,建立用于负载均衡的用户关联和网络功率控制的强化学习模型,根据建立的强化学习模型对当前网络状态下的Q表进行更新,得到下一个网络状态下的Q表,其中,强化学习模型表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910409339.X/2.html,转载请声明来源钻瓜专利网。