[发明专利]基于深度强化学习的车辆边缘计算场景中的智能计算卸载方法在审
申请号: | 202211048897.6 | 申请日: | 2022-08-30 |
公开(公告)号: | CN115460710A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 汪彦婷;钱卓;何立军 | 申请(专利权)人: | 西北工业大学 |
主分类号: | H04W72/08 | 分类号: | H04W72/08;H04W72/12;H04W4/40;G06N3/08 |
代理公司: | 西安匠星互智知识产权代理有限公司 61291 | 代理人: | 陈星 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 车辆 边缘 计算 场景 中的 智能 卸载 方法 | ||
1.一种基于深度强化学习的车辆边缘计算场景中的智能计算卸载方法,其特征在于:包括以下步骤:
步骤1:基于本时间框架内的无线信道增益hi,通过深度神经网络生成一个松弛的卸载决策集合xt;
步骤2:通过保序量化方法将步骤1生成的松弛的卸载决策集合xt量化为K个二进制的卸载决策;
步骤3:将量化得到的每个二进制卸载决策xk代入到问题P1:
s.t.C1:xi∈{0,1}
其中N为车辆终端的数量,xi为车辆终端i(i=1,…,N)的卸载动作,xi=1表示车辆终端i的计算任务卸载到边缘服务器,xi=0表示车辆终端i的计算任务在本地执行;fM为边缘服务器所拥有的总计算资源,fi为边缘服务器分配给车辆终端i的计算资源,Tic为车辆终端i的边缘计算总时延,wi为车辆终端i任务计算时延的权重因子,Til为车辆终端i的本地计算时延,a为边缘服务器向车辆终端传输能量信道时长占比比例,τi为车辆终端i的信道时长占比比例;
将问题P1转化为资源分配子问题P2:
s.t.C2、C3、C4、C5
其中,φ为处理1比特任务数据所需的循环数,Di为车辆终端i上计算任务的数据量,μ为能量收获效率,P为边缘服务器的发射功率,hi为第i个时间周期内的无线信道增益,ki为车辆终端i的计算能效系数,βi为车辆终端i上行链路的传输开销系数;X0和X1分别用于表示采取本地计算和卸载计算车辆的集合;W为无线信道的带宽;σ2为无线信道的高斯噪声频谱密度;
步骤4:将问题P2分解为P3和P4两个子问题:
s.t.C4、C5
s.t.C2、C3
求解问题P3得到时隙分配{a,τ};求解问题P4得到计算资源分配f;
步骤5:对于每个二进制卸载决策,将求解问题P3、P4得到的结果代回问题P1并求解其得到的系统时延,对于所有的二进制卸载决策,选择系统时延最小的二进制卸载决策作为最优卸载决策;
步骤6:将得到的最优卸载决策和无线信道增益hi作为经验标记数据存放到内存中;
步骤7:每隔δ个时间框架,从内存中随机选择一个数据样本,对深度神经网络进行训练,更新深度神经网络中的参数θ,然后返回步骤1,直至方法结束。
2.根据权利要求1所述一种基于深度强化学习的车辆边缘计算场景中的智能计算卸载方法,其特征在于:车辆终端i的边缘计算总时延为Tic为Tic=Tir+Ties,其中Tir为车辆终端i的上行链路数据传输时延,Ties边缘服务器执行车辆终端i传输过来的任务所需要的执行时延。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211048897.6/1.html,转载请声明来源钻瓜专利网。