[发明专利]一种雾无线接入网中基于联邦强化学习的协作缓存方法有效
申请号: | 202110634682.1 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113382059B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 蒋雁翔;张敏 | 申请(专利权)人: | 东南大学 |
主分类号: | H04L67/568 | 分类号: | H04L67/568;H04L67/5682;H04W28/14;H04L41/142;G06N20/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 孙建朋 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 无线 接入 基于 联邦 强化 学习 协作 缓存 方法 | ||
1.一种雾无线接入网中基于联邦强化学习的协作缓存方法,其特征在于,包括以下步骤:
步骤1、根据全局内容流行度Pf(0),初始化缓存节点的本地缓存内容状态s(0),总的模型训练周期T和训练模型的权重参数θ;
步骤2、在第t个时隙,缓存节点n的状态空间s(t)=[i1,i2,...,ic,...,iC],其中,ic表示内容c在缓存节点n中的缓存索引,F表示内容库C 中内容的总个数;缓存节点n的动作空间a(t)∈{0,1},其中,a(t)=1表示在第t个时隙缓存节点中的内容需要被替换,a(t)=0表示在第t个时隙缓存节点中的内容不需要被替换;
步骤3、缓存节点各自计算周期内的内容流行度pnf(t),收集用户的内容请求信息,并基于本地内容缓存状态,做出应答决策;
步骤4、基于步骤3缓存节点做出的应答决策,和周期内的内容流行度pnf(t),计算出缓存命中率hn(t)和用户的内容请求延迟DF-U(t),DF-F-U(t)和DC-F-U(t),DF-U(t)表示用户直接从本地缓存节点获取的它的请求内容所产生的请求延迟,DF-F-U(t)表示用户需要从邻近的缓存节点获取它的请求内容所产生的请求延迟,DC-F-U(t)表示用户需要从云端服务器获取它的请求内容所产生的请求延迟;
步骤5、缓存节点更新本地缓存内容状态s(t)和训练模型参数θ,进入下一个时隙;
步骤6、一个训练周期结束后,对各个缓存节点的模型权重参数θ进行联合更新,进入下一个周期。
2.根据权利要求1所述的雾无线接入网中基于联邦强化学习的协作缓存方法,其特征在于,所述步骤2具体包括以下步骤:
步骤2.1、缓存节点n的状态空间s(t)是已经缓存内容的索引集,根据内容请求频率,状态空间中的内容索引被降序排列,可以减小低频率的内容索引出现在状态空间中的概率;
步骤2.2、内容库C中没有缓存在节点n中的内容组成一个集合
若a(t)=1,将随机从集合中选取k个内容,替换掉在节点缓存中最后的k个内容;
若a(t)=0,缓存节点n不需要进行缓存替代操作;
步骤2.3、在步骤2.2中的缓存替代操作之后,对缓存节点n中的内容索引进行降序更新,得到一个新的状态空间s(t+1)。
3.根据权利要求2所述的雾无线接入网中基于联邦强化学习的协作缓存方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3.1、用户发出请求内容f,若内容f缓存在本地节点中,那么本地节点直接将内容f发送给用户,产生的内容请求延迟为dn1,dn1表示将内容从本地节点发送给用户所需要的时间;
步骤3.2、若本地节点没有缓存内容f,而邻近的缓存节点存储了内容f,那么用户将从邻近的缓存节点中去得到它的请求内容f,产生的内容请求延迟为dn1+dn2,dn2表示两个相邻的节点之间传输内容所需要的时间;
步骤3.3、若本地节点和邻近的缓存节点都没有存储内容f,那么用户将从云端服务器去得到请求内容f,产生的内容请求延迟为dn1+dn3,dn3表示从云端将内容发送到缓存节点需要的传输时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110634682.1/1.html,转载请声明来源钻瓜专利网。