[发明专利]NOMA网络中用户关联与资源分配的模型训练方法有效

申请号：	202011140507.9	申请日：	2020-10-22
公开（公告）号：	CN112272410B	公开（公告）日：	2022-04-19
发明（设计）人：	景文鹏;李子木;赵书越;路兆铭;温向明	申请（专利权）人：	北京邮电大学
主分类号：	H04W72/04	分类号：	H04W72/04;H04W52/34
代理公司：	北京智信四方知识产权代理有限公司 11519	代理人：	钟文芳;宋海龙
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	noma 网络用户关联资源分配模型训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种NOMA网络中用户关联与资源分配的模型训练方法，其中，包括：

获取NOMA异构网络中的样本用户设备在采样时刻的第一传输速率、所述样本用户设备在采样时刻处理任务所需的第一时间、所述样本用户设备在采样时刻从所接入的基站分配到的第一功率；

将所述样本用户设备的所述第一传输速率、所述第一时间和所述第一功率作为DDPG网络模型中Actor网络的输入状态，获得所述Actor网络输出的预测动作，所述预测动作包括所述样本用户设备接入的基站编号的第一预测结果以及所述样本用户设备接入的所述基站的总功率的第二预测结果；

根据NOMA机制确定所述预测动作对应的下一状态，以及计算所述预测动作对应的奖励；所述下一状态包括所述样本用户设备接入所述第一预测结果中的基站以及所述基站的总功率与所述第二预测结果一致时，所述样本用户设备的第二传输速率、所述样本用户设备处理任务所需的第二时间以及所述样本用户设备从所接入的所述基站分配到的第二功率；

将所述输入状态、预测动作、奖励以及下一状态作为一个样本数据加入样本数据集合中；

利用所述样本数据集合训练所述DDPG网络模型；

其中，根据NOMA机制确定所述预测动作对应的下一状态，包括：

获取所述样本用户设备的信道条件；

针对接入同一基站的所述样本用户设备，根据所述信道条件确定所述预测动作下所述样本用户设备从所述基站分配到的第二功率；

其中，计算所述预测动作对应的奖励，包括：

在所述预测动作下，确定所述NOMA异构网络中每个所述样本用户设备处理任务所需的所述第二时间、每个所述样本用户设备从每个所述基站分配得到的所述第二功率以及每个所述样本用户设备在每个所述基站下的所述第二传输速率；

根据所述第二时间、所述第二功率以及所述第二传输速率确定所述NOMA异构网络的性能，将所述性能确定为所述奖励；

其中，利用所述样本数据集合训练所述DDPG网络模型，包括：

利用所述样本用户设备在输入状态下的真实动作对应的奖励值以及所述预测动作对应的奖励值计算动作-状态价值函数Q值；

根据所述动作-状态价值函数Q值对所述DDPG网络模型进行训练。

2.一种NOMA网络中用户关联与资源分配方法，其中，包括：