[发明专利]一种基于强化学习的无线网络资源分配方法在审

申请号：	201810164127.5	申请日：	2018-02-27
公开（公告）号：	CN108401254A	公开（公告）日：	2018-08-14
发明（设计）人：	方武;朱婷	申请（专利权）人：	苏州经贸职业技术学院
主分类号：	H04W16/10	分类号：	H04W16/10;H04W72/08;G06N99/00
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	胡晶
地址：	215009 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于无线网络资源分配以及强化学习领域，特别涉及一种基于强化学习的无线网络资源分配方法。该方法包括初始化步骤、状态检测步骤以及循环步骤。根据当前网络状态，获得当前状态数据；采用Q网络强化学习算法进行优化，可有效提高无线网络能效。该方法适用于无线网络资源的优化分配。
搜索关键词：	无线网络资源强化学习分配强化学习算法状态检测步骤网络状态无线网络循环步骤优化分配状态数据初始化能效优化网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于强化学习的无线网络资源分配方法，其特征在于：它包括以下步骤，初始化步骤：运行Q网络学习算法，即对每个s，a初始化Q(s，a)为0，其中s表示状态，a表示动作，价值函数Q(s，a)表示对状态s下动作a得到的总体期望回报的一个估计，r为t时刻此动作的立即回报，γ为折扣因子，观察当前状态s：获取当前t时刻无线网络状态数据包括，无线网络的信号干扰噪声比：其中Pi，t为接受功耗，Ii，t为t时刻网络i总干扰，N为本地噪声功耗；t时刻无线网络WN i的理论最大吞吐量：Γi，t＝B log2(1+SINRi，t)无线网络WN i的最大可达吞吐量：t时刻无线网络WN i获得的回报奖励：其中，B为指信道的带宽，SNRi为网络信号和噪声的比值，即噪声比，循环步骤：根据当前的信号干扰噪声比作为输入选择一个行为a输入并执行它，选择执行使Q(s，a)最大的行为a，接收立即回报r，观察t+1时刻新状态s′，对Q(s′，a′)按照下式更新：Q(s，a)＝r(s，a)+γ*max Q(s′，a′)状态更新：s＝s′其中α为学习速率，γ为折扣因子。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州经贸职业技术学院，未经苏州经贸职业技术学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810164127.5/，转载请声明来源钻瓜专利网。

上一篇：一种应用信息识别方法、装置以及系统
下一篇：一种双阶段盲频谱感知方案

同类专利

专利分类

H 电学

H04 电通信技术
H04W 无线通信网络
H04W16-00 网络规划，例如覆盖或业务量规划工具；网络配置，例如资源划分或小区结构
H04W16-02 .在各网络组成部分当中的资源划分，例如，再用划分
H04W16-14 .频谱共享装置
H04W16-18 .网络规划工具
H04W16-22 .业务量模拟工具或模型
H04W16-24 .小区结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于强化学习的无线网络资源分配方法在审

专利文献下载