[发明专利]基于强化学习的集群调度系统在审
申请号: | 201810658015.5 | 申请日: | 2018-06-25 |
公开(公告)号: | CN108874545A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 王新雷 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京兰亭信通知识产权代理有限公司 11667 | 代理人: | 赵永刚 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于强化学习的集群调度系统,其特征在于,所述集群调度系统包括连接至少一个计算节点的调度节点,所述调度节点包括集群作业管理器和基于强化学习的负载均衡器;其中,集群作业管理器,接收到所述中断请求后发送当前集群的运算状态至基于强化学习的负载均衡器;基于强化学习的负载均衡器,根据采集到的当前集群的运算状态由计算节点状态向量组成的集群状态矩阵S,根据集群状态矩阵S判断各个计算节点未来宕机或者报错概率,反馈调优动作a至集群作业管理器,计算当前中断时刻t的动作回报r,并利用强化学习方式构建Q函数模型,以获得当前中断时刻t应对集群采用的优化操作。本发明能够提高集群整体利用率,缩短用户平均等待时间偏长。 | ||
搜索关键词: | 强化学习 集群 集群调度系统 负载均衡器 集群作业 计算节点 管理器 矩阵 调度节点 集群状态 运算状态 整体利用率 方式构建 函数模型 优化操作 中断请求 状态向量 中断 报错 宕机 采集 发送 反馈 概率 回报 | ||
【主权项】:
1.一种基于强化学习的集群调度系统,其特征在于,所述集群调度系统包括连接至少一个计算节点的调度节点,所述调度节点包括集群作业管理器和基于强化学习的负载均衡器;所述集群作业管理器,接收所述基于强化学习的负载均衡器时钟间隔为△t的中断请求,并接收到所述中断请求后发送当前集群的运算状态至所述基于强化学习的负载均衡器;所述基于强化学习的负载均衡器,根据采集到的所述当前集群的运算状态由计算节点状态向量组成的集群状态矩阵S,根据所述集群状态矩阵S判断各个计算节点未来宕机或者报错概率,反馈调优动作a至所述集群作业管理器,计算当前中断时刻t的动作回报r,并利用强化学习方式构建基于各个计算节点的节点温度、资源利用率、作业总数以及所述集群状态矩阵S的Q函数模型,以估计每一中断时刻的集群状态矩阵S所对应的预期未来收益值Q,从而获得当前中断时刻t应对集群采用的优化操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810658015.5/,转载请声明来源钻瓜专利网。