[发明专利]一种分布式集群及并行计算任务调度方法有效
申请号: | 201810858396.1 | 申请日: | 2018-07-31 |
公开(公告)号: | CN109343939B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 张展国;张妮;罗开明;徐大青;贺彪;王少鹏;吕梦婷 | 申请(专利权)人: | 国家电网有限公司;许继集团有限公司;许昌许继软件技术有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 陈浩 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 集群 并行 计算 任务 调度 方法 | ||
本发明涉及一种分布式集群及并行计算任务调度方法,将待处理的任务进行分解,并对分解的子任务分配到多个任务机上执行,当已经完成的子任务数量与所有子任务数量的占比达到设定比值时,将剩余没有完成的子任务进行再分解,将分解得到的次级子任务分配到其他空闲的任务机上执行。本发明利用集群空闲资源对进度滞后的子任务进行同步计算,提高了任务运行的可靠性,加快了计算任务的运行速度,同时缩短了任务的执行时间。
技术领域
本发明属于分布式系统并行计算任务调度技术领域,具体涉及一种分布式集群及并行计算任务调度方法。
背景技术
近年来,以大数据、云计算、物联网和移动互联网为代表的新一代信息技术蓬勃发展,而支撑这些信息技术发展的任务机(即服务器)规模也越来越庞大。并且随着信息技术应用领域的不断扩展,不同的任务机经常需要同时执行用户的多个应用(即任务)。因此如何高效、合理地对这些跨任务机执行的应用的服务关系进行管理、维护和调度,就成为迫切需要解决的问题。
随着信息技术的发展,针对海量数据的复杂计算任务,垂直升级任务机的配置已经不能满足任务的运行需要,水平扩展任务机集群已被公认是解决问题的最佳办法,但多任务机执行任务,调度的复杂度成倍增加,在现有的分布式系统中任务调度(尤其是分布式内存计算领域)就存在以下问题:
第一,对于每个任务(Task),客户端向分布式系统提交请求时,分布式系统会随机选择一台任务机启动一个针对该任务的管理模块(App master),负责任务的分配与执行状态的监控,但在大型分布式集群中,单台任务机出现故障的概率比较高,而现有的做法是在App master故障一段时间后,分布式系统针对该任务再重新启动一个App master,监控整个任务的运行情况,但从旧App master故障发生到新的App master启动成功,历时时间较长,大型复杂的任务计算实时性无法保证;
第二,对于大型且复杂的任务,可以拆分成多个子任务并发运行,子任务运行过程中会通过心跳向任务管理模块汇报任务状态,但由于任务机自身配置等原因,有些子任务的执行速度过于缓慢,以至于拖延了整个任务的完成时间,进而降低了整个分布式系统对外提供服务的性能。
例如,一篇公布号为CN106874094A、名称为“定时任务处理方法、装置及计算设备”的中国专利就存在上述问题。
发明内容
本发明的目的是提供一种分布式集群及并行计算任务调度方法,用于解决现有分布式系统并行任务的调度和执行效率慢的问题。
为解决上述技术问题,本发明提出一种基于分布式系统的并行计算任务调度方法,包括以下方法方案:
方法方案一,包括如下步骤:
1)根据接收的任务请求,将任务分解成两个以上的子任务,将各子任务分配到各任务机上;
2)实时监测各子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的每个子任务分解成两个以上的次级子任务,将各次级子任务分配到空闲的任务机上。
方法方案二,在方法方案一的基础上,各次级子任务分配到空闲的任务机上进行运算的同时,保持所述剩余未完成的子任务在原来的任务机上继续进行运算,选择最先输出的运行结果作为最终的运行结果。
方法方案三,在方法方案一的基础上,还包括根据接收的任务请求选择第一任务机的步骤,第一任务机用于将任务分解成两个以上的子任务,并将各子任务分配到各任务机上,以及用于监视各任务机执行子任务的进度。
方法方案四,在方法方案三的基础上,包括根据接收的任务请求选择第二任务机的步骤,第二任务机用于在第一任务机工作异常时代替第一任务机工作。
方法方案五,在方法方案四的基础上,所述第一任务机和第二任务机分别设在分布式系统的不同任务机架上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;许继集团有限公司;许昌许继软件技术有限公司,未经国家电网有限公司;许继集团有限公司;许昌许继软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810858396.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种事件统计方法
- 下一篇:一种云平台中多媒体任务调度优化方法