[发明专利]边缘计算任务的在线分派调度方法和系统有效
申请号: | 202110348337.1 | 申请日: | 2021-03-31 |
公开(公告)号: | CN112799823B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 郭得科;袁昊;郑龙;魏超;罗来龙;吴亚辉;唐国明 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 边缘 计算 任务 在线 分派 调度 方法 系统 | ||
1.一种边缘计算任务的在线分派调度方法,应用于边缘计算任务的在线分派调度系统,所述在线分派调度系统包括:
用户终端,接入点和边缘服务器;
所述边缘计算任务的在线分派调度方法包括:
所述用户终端将任务发送给所述接入点;
所述接入点根据最优分派策略从若干所述边缘服务器选择目标边缘服务器,并将所述任务分派到所述目标边缘服务器;其中,所述最优分派策略由多臂老虎机模型生成;其中,所述接入点根据最优分派策略从若干所述边缘服务器选择目标边缘服务器,具体包括:
对于每个所述边缘服务器,计算其置信区间上界;所述置信区间上界的计算公式为:;其中,为边缘服务器
其中,为边缘服务器在i时刻获得的奖励;
将所述置信区间上界最大的所述边缘服务器确定为所述目标边缘服务器;
所述目标边缘服务器根据多队列加权循环调度模型对所述任务进行处理,并将处理后的所述任务反馈给所述接入点;其中,所述多队列加权循环调度模型包括:调度器、任务缓冲区和处理池;
所述奖励包括外部奖励与加权后的内部奖励,在
其中,为权重,为外部奖励,为内部奖励;
所述外部奖励为:
其中,为所述任务从所述接入点到所述边缘服务器
所述内部奖励为:
;
其中,为所述任务在所述处理池中的处理时延,为内部时延,,为所述任务在所述任务缓冲区的等待时延;
所述目标边缘服务器根据多队列加权循环调度模型对所述任务进行处理,包括:
所述目标边缘服务器将所述任务存储至所述任务缓冲区等待处理;
所述目标边缘服务器将结束等待后的所述任务送入所述处理池;
所述目标边缘服务器通过最优调度策略对所述处理池中的所述任务进行处理;其中,所述最优调度策略由基于DQN模型的所述调度器产生;
所述接入点将所述处理后的所述任务发送给所述用户终端。
2.根据权利要求1所述的边缘计算任务的在线分派调度方法,其中,所述DQN模型包括主网络和目标网络;
所述DQN模型的损失函数为:
其中为所述主网络的参数,为所述主网络生成的评估当前环境状态和动作的当前Q值,为所述目标网络生成的目标Q值,其计算公式为:
其中为所述目标网络的参数, 是折扣累计因子,为下一时刻环境状态和下一时刻动作的Q值,是奖励。
3.根据权利要求2所述的边缘计算任务的在线分派调度方法,其中,所述最优调度策略通过以下方法生成:
所述调度器获取存储在所述处理池和所述任务缓冲区的任务的基本信息;
所述调度器从所述基本信息中实时获取环境状态;
所述调度器根据当前时刻的所述环境状态,以方法执行Q值最大的动作,生成所述最优调度策略;
所述调度器根据奖励函数获得所述动作的奖励;
所述调度器根据所述奖励使用经验回放法更新所述主网络,得到更新后的所述主网络;
所述调度器根据所述更新后的所述主网络使用随机梯度下降法更新所述目标网络。
4.根据权利要求3所述的一种边缘计算任务的在线分派调度方法,其中,所述奖励函数,定义如下:
其中为权重,s(t)为某一时刻的环境状态,a(t)为某一时刻的动作;
表示所述任务缓冲区中任务的平均等待时间;表示所述处理池中任务的平均处理时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110348337.1/1.html,转载请声明来源钻瓜专利网。