[发明专利]NOMA网络中用户关联与资源分配的模型训练方法有效
申请号: | 202011140507.9 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112272410B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 景文鹏;李子木;赵书越;路兆铭;温向明 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04W72/04 | 分类号: | H04W72/04;H04W52/34 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 钟文芳;宋海龙 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | noma 网络 用户 关联 资源 分配 模型 训练 方法 | ||
1.一种NOMA网络中用户关联与资源分配的模型训练方法,其中,包括:
获取NOMA异构网络中的样本用户设备在采样时刻的第一传输速率、所述样本用户设备在采样时刻处理任务所需的第一时间、所述样本用户设备在采样时刻从所接入的基站分配到的第一功率;
将所述样本用户设备的所述第一传输速率、所述第一时间和所述第一功率作为DDPG网络模型中Actor网络的输入状态,获得所述Actor网络输出的预测动作,所述预测动作包括所述样本用户设备接入的基站编号的第一预测结果以及所述样本用户设备接入的所述基站的总功率的第二预测结果;
根据NOMA机制确定所述预测动作对应的下一状态,以及计算所述预测动作对应的奖励;所述下一状态包括所述样本用户设备接入所述第一预测结果中的基站以及所述基站的总功率与所述第二预测结果一致时,所述样本用户设备的第二传输速率、所述样本用户设备处理任务所需的第二时间以及所述样本用户设备从所接入的所述基站分配到的第二功率;
将所述输入状态、预测动作、奖励以及下一状态作为一个样本数据加入样本数据集合中;
利用所述样本数据集合训练所述DDPG网络模型;
其中,根据NOMA机制确定所述预测动作对应的下一状态,包括:
获取所述样本用户设备的信道条件;
针对接入同一基站的所述样本用户设备,根据所述信道条件确定所述预测动作下所述样本用户设备从所述基站分配到的第二功率;
其中,计算所述预测动作对应的奖励,包括:
在所述预测动作下,确定所述NOMA异构网络中每个所述样本用户设备处理任务所需的所述第二时间、每个所述样本用户设备从每个所述基站分配得到的所述第二功率以及每个所述样本用户设备在每个所述基站下的所述第二传输速率;
根据所述第二时间、所述第二功率以及所述第二传输速率确定所述NOMA异构网络的性能,将所述性能确定为所述奖励;
其中,利用所述样本数据集合训练所述DDPG网络模型,包括:
利用所述样本用户设备在输入状态下的真实动作对应的奖励值以及所述预测动作对应的奖励值计算动作-状态价值函数Q值;
根据所述动作-状态价值函数Q值对所述DDPG网络模型进行训练。
2.一种NOMA网络中用户关联与资源分配方法,其中,包括:
获取NOMA异构网络的初始数据;所述初始数据包括所述NOMA异构网络中用户所接入的基站编号、基站的总功率、所述用户从所接入的基站分配得到的功率;
将所述初始数据输入至DDPG网络模型,由所述DDPG网络模型输出所述NOMA异构网络中用户关联与资源分配的解决方案;其中,所述DDPG网络模型利用权利要求1所述的方法得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011140507.9/1.html,转载请声明来源钻瓜专利网。