[发明专利]一种移动边缘计算环境下的工作流任务卸载方法及系统有效
申请号: | 202111422606.0 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114116061B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 高永强;李泽民 | 申请(专利权)人: | 内蒙古大学 |
主分类号: | G06F9/445 | 分类号: | G06F9/445;H04W28/08 |
代理公司: | 北京冬瓜知识产权代理事务所(普通合伙) 11854 | 代理人: | 李佳 |
地址: | 010020 内蒙古自*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 边缘 计算 环境 工作流 任务 卸载 方法 系统 | ||
1.一种移动边缘计算环境下的工作流任务卸载方法,其特征在于,包括以下步骤:
S1:获取无线设备的信息,计算信道增益值,构建信道模型;
S2:生成卸载计算模式及本地计算模式,并得到两种计算模式下的数据计算速率;
S3:构建工作流任务卸载模型并设定约束条件;
S4:构建马尔可夫决策模型,确定卸载策略函数;
卸载策略函数为:
卸载策略函数确定的步骤包括:
S41:根据每个状态下的熵确定动作方程,每个状态下的熵H为:
H(π(·|st+1))=-Ealogπ(at|st)
动作方程为:
表示为Rt在st状态下选择at动作,其中β表示为学习率;
S42:由Soft Bellman Backup equation方程更新得到Q(st,at)的估计动作方程:
表示为st和at的最大奖励等于下一个动作at+1的奖励总和减去at+1动作下的熵;
S43:卸载策略函数的变换由信道增益值h决定:
根据得到估计状态方程:
根据每个状态下的熵得到估计最优动作方程:
S44:根据估计最优动作方程得到最优卸载策略函数:
根据边缘计算网络的计算率奖励函数构建马尔可夫决策模型,所述马尔可夫决策模型包括:
(S,A,R,P)
其中,S={s1,s2....sn}代表状态空间,si={oi};
A={a1,a2....at}代表动作空间,at={ht}表示为不同时刻的信道增益值,t表示单位为T时间帧;
R:S×A,代表奖励函数;
P代表状态转移概率;
S5:采用SAC模型求解卸载策略函数,进行工作流任务的卸载;
所述SAC模型包括SAC深度神经网络模型,求解卸载策略函数的步骤包括:
S51:通过Q-value网络对Q函数进行模拟,Q函数为每个时刻下的动作-状态对函数;
S52:通过策略网络对策略函数π进行模拟,得到策略网络;
S53:根据当前的Q值和V值得到熵H,将熵H加到当前的奖励R上,根据Soft BellmanBackup equation方程迭代更新Q值直至收敛;
S54:更新当前的策略π得到最优卸载策略,进行工作流任务的卸载。
2.根据权利要求1所述的工作流任务卸载方法,其特征在于,步骤S1中,所述无线设备的信息包括:信道增益值变化临界点时无线设备和边缘基站的参考距离、无线设备和边缘基站的实际距离以及信道能量损失系数。
3.根据权利要求2所述的工作流任务卸载方法,其特征在于,步骤S1中,根据获取的无线设备信息计算信道增益值,所述信道增益值的计算包括:
其中,h为信道增益值,d0为信道增益值变化临界点时无线设备和边缘基站的参考距离,d无线设备和边缘基站的实际距离,α为常系数,其中α∈{0,1},ω为信道能量损失系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古大学,未经内蒙古大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111422606.0/1.html,转载请声明来源钻瓜专利网。