[发明专利]雾无线接入网中基于联邦强化学习的智能编码缓存方法在审
申请号: | 202111258088.3 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113923128A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 蒋雁翔;陈颖琦 | 申请(专利权)人: | 东南大学 |
主分类号: | H04L41/14 | 分类号: | H04L41/14;H04L41/147;H04L67/10;G06N3/04;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 孙建朋 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无线 接入 基于 联邦 强化 学习 智能 编码 缓存 方法 | ||
1.一种雾无线接入网中基于联邦强化学习的编码缓存方法,其特征在于,包括以下步骤:
步骤1、在云中心服务器构建全局模型θG并初始化,在每个雾接入点处布置学习代理并初始化其本地模型θk;
步骤2、在时隙t末端,系统观察全局状态s(t),每个雾接入点观察其本地状态sk(t);
步骤3、系统根据观察到的全局状态s(t),使用全局模型预测并实施实际编码缓存内容放置决策a(t),同时每个雾接入点根据其观察到的本地状态sk(t)预测并记录虚拟内容放置决策ak(t);
步骤4、时隙t+1内,系统根据实施的内容放置决策a(t),使用多播编码传输方式满足各个雾接入点接收的请求;
步骤5、在时隙t+1末端,本地状态变为sk(t+1),每个雾接入点统计时隙t+1内其服务用户的内容请求情况,并根据其虚拟放置决策ak(t)计算理论时延和虚拟反馈rk(t),存储本地学习经验[sk(t),ak(t),rk(t),sk(t+1)]T;
步骤6、每个雾接入点随机抽样其本地学习经验进行训练,实现本地模型更新;
步骤7、每隔TA个时隙,所有雾接入点将其本地模型上传至云中心服务器整合,并下载整合后的全局模型用于其替换本地模型;
步骤8、重复执行步骤2至步骤7,直至全局模型在连续时隙的预测性能波动小于5%。
2.根据权利要求1所述的雾无线接入网中基于联邦强化学习的编码缓存方法,其特征在于,所述步骤1具体包括以下步骤:
步骤1.1、云中心服务器构建神经网络Q(s,a;θG),其中s为当前全局状态向量,a为全局内容放置决策向量,θG为全局网络模型参数并被随机初始化;
步骤1.2、对于为雾接入点索引集合,K为雾接入点的数目,雾接入点k构建神经网络Q(sk,ak;θk),其中sk为当前本地状态向量,ak为本地内容放置决策向量,θk为本地网络模型参数并被随机初始化。
3.根据权利要求1所述的雾无线接入网中基于联邦强化学习的编码缓存方法,其特征在于,所述步骤2具体包括以下步骤:
步骤2.1、在时隙t末端,系统观察全局状态其中a(t-1)为t-1时隙系统做出的全局缓存决策,为t时隙系统内所有N个文件的统计请求频率向量;
步骤2.2、同时,对于雾接入点k观察其本地状态其中ak(t1)为t-1时隙记录的本地缓存决策,为时隙t雾接入点k内所有N个文件的请求频率向量。
4.根据权利要求1所述的雾无线接入网中基于联邦强化学习的编码缓存方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3.1、在时隙t末端,系统根据观察到的全局状态s(t),使用全局模型预测并实施实际编码缓存内容放置决策其中Nc(t)表示编码缓存的文件数目,cn(t)=1表示文件n被选择,cn(t)=0则表示文件n未被选择;
步骤3.2、对于雾接入点k根据观察到的本地状态sk(t),使用其本地模型预测并记录虚拟编码缓存内容放置决策其中表示编码缓存的文件数目,表示文件n被选择,则表示文件n未被选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111258088.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海洋工程装备标识解析方法及系统
- 下一篇:一种链式传送运输带