[发明专利]一种任务调度方法和装置有效
申请号: | 201711036985.3 | 申请日: | 2017-10-30 |
公开(公告)号: | CN109725988B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 陆韬 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;杨晓伟 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 任务 调度 方法 装置 | ||
1.一种任务调度方法,其特征在于,包括:
将任务调度的时刻作为状态,将单个任务的调度执行作为动作以构建动作价值函数;
将集群在时间上的平均负载作为奖赏,根据所述奖赏采用强化学习算法对所述动作价值函数进行迭代计算,以得到收敛函数值;
根据所述状态、动作和收敛函数值进行任务调度;
其中,根据所述状态、动作和收敛函数值进行任务调度,包括:
根据所述状态、动作和收敛函数值建立调度表;其中,所述调度表的行代表动作,列代表状态,每个行列表格中的值为所述状态和动作对应的收敛函数值;
根据所述调度表,获取当前状态对应的最大收敛函数值;
按照所述最大收敛函数值对应的动作进行任务调度。
2.根据权利要求1所述的方法,其特征在于,所述强化学习算法为Q-Learning算法。
3.根据权利要求2所述的方法,其特征在于,所有所述的任务调度的时刻构成状态集,所有所述的任务的调度执行构成动作集;
当根据所述奖赏采用Q-Learning算法对所述动作价值函数进行迭代计算时,包括:
初始化所述动作价值函数的函数值,设置所述动作价值函数的当前状态;
根据所述当前状态和策略,从所述动作集中选择一个动作;
执行所述动作以得到所述奖赏和下一个状态;
根据所述奖赏和所述下一个状态,更新所述动作价值函数;
将所述下一个状态作为当前状态,重复迭代直至到达所述状态集的终止状态。
4.根据权利要求3所述的方法,其特征在于,所述根据所述奖赏和所述下一个状态,更新所述动作价值函数的步骤中,更新所述动作价值函数的计算公式为:
Q(s,a)←(1-α)×Q(s,a)+α[R+γmaxaQ(s',a)]
s←s'
其中,s为当前状态;a为动作;Q(s,a)为动作价值函数,表示在当前状态s执行动作a所获得的收敛函数值;α为学习率;R为奖赏;γ为折扣因子;s'为下一状态;maxaQ(s',a)为下一状态s'所采取动作的最大收敛函数值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述状态、动作和收敛函数值进行任务调度的步骤之后,还包括:当需要调度的任务发生改变时,根据当前状态和策略对所述调度表进行更新。
6.一种任务调度装置,其特征在于,包括:
函数构建模块,用于将任务调度的时刻作为状态,将单个任务的调度执行作为动作以构建动作价值函数;
迭代计算模块,用于将集群在时间上的平均负载作为奖赏,根据所述奖赏采用强化学习算法对所述动作价值函数进行迭代计算,以得到收敛函数值;
任务调度模块,用于根据所述状态、动作和收敛函数值进行任务调度;其中,根据所述状态、动作和收敛函数值进行任务调度,包括:
根据所述状态、动作和收敛函数值建立调度表;其中,所述调度表的行代表动作,列代表状态,每个行列表格中的值为所述状态和动作对应的收敛函数值;
根据所述调度表找出当前状态对应的最大收敛函数值;
按照所述最大收敛函数值对应的动作进行任务调度。
7.根据权利要求6所述的装置,其特征在于,所述强化学习算法为Q-Learning算法。
8.根据权利要求7所述的装置,其特征在于,所有所述的任务调度的时刻构成状态集,所有所述的任务的调度执行构成动作集;
所述迭代计算模块,还用于:
初始化所述动作价值函数的函数值,设置所述动作价值函数的当前状态;
根据所述当前状态和策略,从所述动作集中选择一个动作;
执行所述动作以得到所述奖赏和下一个状态;
根据所述奖赏和所述下一个状态,更新所述动作价值函数;
将所述下一个状态作为当前状态,重复迭代直至到达所述状态集的终止状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711036985.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式事务一致性解决方法及相关设备
- 下一篇:一种任务执行的方法及装置