[发明专利]支持D2D通信的分层无线网络下的边缘协作缓存方法在审
申请号: | 201910378071.8 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110290510A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 王晓飞;李文凯;王晨阳;李丁;韩溢文 | 申请(专利权)人: | 天津大学 |
主分类号: | H04W4/80 | 分类号: | H04W4/80;H04W16/22;H04W28/14 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李佳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 请求内容 协作缓存 强化学习算法 分层无线网络 缓存 命中 内容请求 移动无线网络 用户请求内容 无监督学习 用户设备层 传输时延 蜂窝网络 流量传输 路由选择 用户设备 优化目标 最大化 命中率 卸载 更新 配置 应用 | ||
1.一种支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,包括:
根据内容请求查看本设备的本地缓存中是否包含请求内容,其中本设备为接收所述内容请求的设备;
如果包含,则命中所述请求内容;如果不包含,则基于深度强化学习算法进行路由选择以命中所述请求内容;
命中所述请求内容后更新所述深度强化学习算法的模型。
2.根据权利要求1所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,所述基于深度强化学习算法进行路由选择以命中所述请求内容包括:
将内容请求转发到D2D通信范围内的其他一台或多台设备,查看接收到所述内容请求的设备是否包含所述请求内容;
如果包含,则命中所述请求内容;如果不包含,则将请求转发至相邻基站以命中所述请求内容;
本设备缓存替换命中所述请求内容。
3.根据权利要求2所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,所述缓存命中所述请求内容之前还包括:
检测本地缓存是否已满;
若是,则先缓存配置算法,再进行下一步;若否,则直接进行下一步。
4.根据权利要求3所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,所述缓存替换命中所述请求内容由所述深度强化学习算法的模型控制。
5.根据权利要求1-4任一项所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,所述深度强化学习算法包括:
获得本设备的当前状态;
针对当前状态,从Q-Table中选择奖励值最高的动作,并执行该动作;
进入下一状态,根据下一状态的命中率情况和奖惩函数对当前状态的所述动作进行奖惩;
根据所述奖惩更新Q-Table。
6.根据权利要求5所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,根据下一状态的命中率情况和奖惩函数对动作进行奖惩包括:
若所述动作合理,即所述下一状态的命中率提升,则对该动作进行奖励;
若所述动作不合理,即所述下一状态的命中率下降,则对该动作进行惩罚。
7.根据权利要求6所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,所述奖惩函数为:
其中,χi为当前状态;Φ(χi)为动作空间;为奖励函数;为惩戒函数;为请求通过D2D链路处理;表示请求通过蜂窝链路处理。
8.根据权利要求7所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,通过DQN中的神经网络来近似估计近似的值函数其包括:
用神经网络的方法来估计值函数:
用方差公式来定义损失函数,并使用梯度下降GD来更新参数;
Agent获取所有的Q(χ,Φ),并利用∈-greedy选择Φ并做出决策。
9.根据权利要求5所述的支持D2D通信的分层无线网络下的边缘协作缓存方法,其特征在于,所述当前状态包括:当前请求内容和当前缓存情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910378071.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据传输方法及装置
- 下一篇:RFID标签加密的方法及装置