[发明专利]一种基于深度增强学习的无线网络资源分配方法有效

申请号：	201811535056.1	申请日：	2018-12-14
公开（公告）号：	CN109474980B	公开（公告）日：	2020-04-28
发明（设计）人：	张海君;刘启瑞;皇甫伟;董江波;隆克平	申请（专利权）人：	北京科技大学
主分类号：	H04W52/14	分类号：	H04W52/14;H04W52/24;H04W52/26;H04W52/34;H04W72/04;H04W72/08;G06N3/08;G06N3/04
代理公司：	北京市广友专利事务所有限责任公司 11237	代理人：	张仲波
地址：	100083***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于深度增强学习的无线网络资源分配方法，能够以较低复杂度最大限度地提高时变信道环境中的能量效率。所述方法包括：建立深度增强学习模型；将基站与用户终端之间的时变信道环境建模为有限状态的时变马尔科夫信道，确定归一化信道系数，并输入卷积神经网络qeval，选择输出回报值最大的动作作为决策动作，为用户分配子载波；根据子载波分配结果，基于信道系数的反比为每个子载波上复用的用户分配下行功率，基于分配的下行功率确定回报函数，并将回报函数反馈回深度增强学习模型；根据确定的回报函数，训练深度增强学习模型中的卷积神经网络qeval、qtarget，确定时变信道环境下功率局部最优分配。本发明涉及无线通信以及人工智能决策领域。
搜索关键词：	一种基于深度增强学习无线网络资源分配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度增强学习的无线网络资源分配方法，其特征在于，包括：S101，建立由两张相同参数的卷积神经网络qeval、qtarget构成深度增强学习模型；S102，将基站与用户终端之间的时变信道环境建模为有限状态的时变马尔科夫信道，确定基站与用户之间的归一化信道系数，并输入卷积神经网络qeval，选择输出回报值最大的动作作为决策动作，为用户分配子载波；S103，根据子载波分配结果，基于信道系数的反比为每个子载波上复用的用户分配下行功率，基于分配的下行功率确定系统能量效率，基于所述系统能量效率确定回报函数，并将回报函数反馈回深度增强学习模型；S104，根据确定的回报函数，训练深度增强学习模型中的卷积神经网络qeval、qtarget，若连续多次所得的系统能量效率值与预设阈值之间的差值在预设的范围内或高于预设阈值，则当前分配的下行功率为时变信道环境下功率局部最优分配。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京科技大学，未经北京科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811535056.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04W 无线通信网络
H04W52-00 功率管理，例如，TPC[传输功率控制]，功率节省或功率分级
H04W52-02 .功率节省装置
H04W52-04 .TPC[传输功率控制]
H04W52-06 ..TPC算法
H04W52-18 ..根据特定参数执行TPC
H04W52-30 ..在可用传输功率的总量中使用约束

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度增强学习的无线网络资源分配方法有效

专利文献下载