[发明专利]一种基于强化学习的可靠车载边缘计算卸载方法有效
申请号: | 202110109732.4 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112929849B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 王俊华;岳玉宸;高广鑫 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | H04W4/44 | 分类号: | H04W4/44;H04L67/10;H04L41/16;H04B7/155;H04B7/185 |
代理公司: | 南京合砺专利商标代理事务所(普通合伙) 32518 | 代理人: | 刘渊 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 可靠 车载 边缘 计算 卸载 方法 | ||
1.一种基于强化学习的可靠车载边缘计算卸载方法,其特征在于:包括如下步骤:
(1)构建车辆通信系统实现车辆与边缘服务器的通信,所述车辆包括搭载有数据中心,所述边缘服务器包括路侧单元及无人机;
(2)建立车辆与边缘服务器的通信网络,确定边缘计算的多目标优化问题和约束条件,具体数学模型表达式如下所示:
(C4)xi,j∈{0,1},
其中若xi,j=1表示任务vi,j卸载至无人机,若xi,j=0则表示任务vi,j通过无人机作为中继,且卸载至路侧单元;表示第i车辆传输第j任务所需的传输功率;C1表示保证传输可靠性的约束条件,其中γi,j表示信噪比,γtgt表示目标信噪比,1-ε表示可靠性阈值,ε为最大耐受传输错误率;表示传输功率的分布集,C2表示计算资源总消耗不能超过无人机的最大可用计算能力,其中表示任务vi,j在无人机计算时的频率;C3表示移动车辆分配的传输功率不能超过功率阈值;C4表示二进制变量的约束;
具体计算过程如下:
(21)定义“传输可靠性”为成功传输概率超过给定的可靠性阈值的可能性,其数学表达式为:
Pr(γi,j≥γtgt)≥1-ε;
(22)获取卸载任务vi,j至无人机的信噪比γi,j,其计算公式为:
其中K0为系统常量,disi,j表示当第i车辆传输第j任务时与无人机的距离,e表示路径损耗指数,N0表示噪声功率,|hi,j|表示信道衰减参数,符合均值μh和方差Ch的一类分布;
(23)获取任务vi,j从车辆传输至无人机的速率为:
其中ωi,j表示任务vi,j所分配的带宽;
(24)计算任务vi,j分别卸载至无人机或路侧单元的时延,其计算公式为:
其中表示任务vi,j从车辆至无人机的传输速率,表示任务vi,j从无人机至路侧单元的传输速率,和分别表示任务vi,j在无人机或者路侧单元执行时的计算频率,Ai,j和Bi,j分别表示任务vi,j传输数据和计算数据的大小;
(25)基于参数和获取任务vi,j的总延迟,其计算公式为:
(26)获取系统效用函数Ui,j,其计算方式为:
Ui,j=αi,jlog(1+χ-di,j);
其中αi,j是满意度参数,χ用来调整对数函数使其非负;
(27)获取计算能源消耗Ei,j,其计算公式为:
其中是任务vi,j在无人机上的传输功率,κu表示有效电容系数,由无人机的CPU硬件结构决定;
(3)基于最小化能源消耗和最大化系统效用为目标,分解多目标优化任务,确定功率分配任务和计算卸载任务;
其中,对于功率分配任务的具体计算过程如下:
(s31)基于信道衰减参数|hi,j|,引入变量使得令其中α表示信道路径损耗指数,令符合如下分布:
(s32)“传输可靠性”的机会约束可表示为:
(s33)使用广义的Chebyshev不等式转化机会约束,其表示为:
(s34)满足高度可靠的通信要求,推导出在最坏情况的信道条件下,成功传输任务vi,j所需要的最小传输功率,其计算公式为:
对于计算卸载任务过程具体如下:
(S31)将多目标优化任务转化为马尔可夫决策模型,划分为若干个时间片t,在时间t的系统状态s可表示为:
其中表示无人机当前状态下可用计算资源,表示所有边缘服务器当前状态下剩余的可用能源;
在时间t的动作a可表示为:
a(t)={λ0(t),λ1(t)};
其中λ0(t)+λ1(t)=1,分别表示计算任务卸载到路侧单元或者无人机的概率;
(S32)定义π为在状态s选择动作a可能性的策略函数,在策略π下,状态和动作对s,a的函数值被定义为Qπ(s,a),其计算公式为:
其中σ∈(0,1)是学习速率,δ反映在未来迭代中的预测奖励的重要性的折扣率;
(S33)令w和w'分别表示训练网络和目标网络的参数集,获取目标Q值,其计算公式为:
(S34)训练网络的参数集w根据损失函数进行更新,损失函数表示为:
Loss(w)=E[y(s,a)-Qπ(s,a,w)]2;
(S35)利用优化的返回值G(s,a)替代目标Q值y(s,a),更新后的损失函数表示为:
Loss(w)=E[G(s,a)-Qπ(s,a,w)]2;
(S36)利用DQN中的优先经验回放,提高深度强化学习过程中的学习性能,利用深度强化学习模型通过离线方式,学习不同任务卸载实例数据的调度经验,无人机保存训练好的模型进行在线更新;
(4)根据车辆与边缘服务器构建的通信网络,边缘服务器完成车载边缘计算任务并反馈至车辆。
2.根据权利要求1所述的基于强化学习的可靠车载边缘计算卸载方法,其特征在于:步骤(1)所述路侧单元为设置在道路旁的固定式服务器,所述无人机搭载有服务器,包括处理车辆数据中心的计算任务或作为中继将该计算任务进行转发至路侧单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110109732.4/1.html,转载请声明来源钻瓜专利网。