[发明专利]一种基于深度强化学习算法的D2D用户资源分配方法及存储介质在审

申请号：	202310426343.3	申请日：	2023-04-20
公开（公告）号：	CN116456493A	公开（公告）日：	2023-07-18
发明（设计）人：	李君;刘兴鑫;刘子怡;沈国丽;张茜茜;李晨	申请（专利权）人：	无锡学院
主分类号：	H04W72/40	分类号：	H04W72/40;H04W72/50;H04W72/543;H04W52/02;H04W24/02;G06N3/045;G06N3/092;G06N7/01
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	彭晓勤
地址：	214105 江苏***	国省代码：	江苏;32
权利要求书：	暂无信息	说明书：	暂无信息
摘要：	本发明公开了一种基于深度强化学习算法的D2D用户资源分配方法及存储介质，涉及无线通信技术领域。所述方法包括：构建无线网络模型，对D2D发射功率进行离散化处理；构建用户信噪比计算模型，以通信系统吞吐量最大为优化目标；设置预测策略网络π、预测价值网络Q、目标策略网络π′和目标价值网络Q'；将D2D通信环境建模为马尔可夫决策过程，将D2D发射机视为智能体，循环加载目标策略网络的参数后生成策略与环境进行交互，确定状态空间、动作空间及奖励函数；采用MAAC算法对每个D2D用户进行策略优化；采用软更新方式循环更新目标策略网络和目标价值网络的参数，直至完成学习训练；D2D用户下载完成训练的目标策略网络的参数，进行策略改进。
搜索关键词：	一种基于深度强化学习算法 d2d 用户资源分配方法存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于无锡学院，未经无锡学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202310426343.3/，转载请声明来源钻瓜专利网。

上一篇：一种基于强化学习的金纳米棒AuNRs合成方法、系统
下一篇：一种鸡舍用智能化卷帘门及使用方法

同类专利

专利分类

H 电学

H04 电通信技术
H04W 无线通信网络
H04W72-00 本地资源管理，例如，无线资源的选择或分配或无线业务量调度
H04W72-02 .通过用户或终端选择无线资源
H04W72-04 .无线资源分配
H04W72-12 .无线业务量调度
H04W72-14 ..使用授权的信道
H04W72-06 ..基于无线资源的等级标准

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度强化学习算法的D2D用户资源分配方法及存储介质在审

专利文献下载