[发明专利]Hadoop集群系统的调度方法、调度装置及其应用有效
申请号: | 201310651432.4 | 申请日: | 2013-12-03 |
公开(公告)号: | CN103685492B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 田文洪;陈瑜;王心阳 | 申请(专利权)人: | 北京智谷睿拓技术服务有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙)11413 | 代理人: | 马敬,项京 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | hadoop 集群 系统 调度 方法 装置 及其 应用 | ||
1.一种Hadoop集群系统调度方法,其特征在于,所述方法包括步骤:
为每个作业分配系统可用的最大资源;
根据作业属性,按照Johnson算法安排作业的执行顺序;
按照所述执行顺序调度作业。
2.根据权利要求1所述的方法,其特征在于,所述为每个作业分配系统可用的最大资源中:
当作业请求的系统资源R等于系统可用的最大资源S时,为所述作业分配所述系统可用的最大资源S。
3.根据权利要求1所述的方法,其特征在于,所述为每个作业分配系统可用的最大资源中:
当作业请求的系统资源R小于系统可用的最大资源S时,根据所述系统可用的最大资源S对所述作业分片,并为分片后的所述作业分配所述系统可用的最大资源S。
4.根据权利要求1所述的方法,其特征在于,所述为每个作业分配系统可用的最大资源中:
当作业请求的系统资源R大于系统可用的最大资源S时,按照执行N波来为所述作业分配资源;
其中,N=R/S向上取整。
5.根据权利要求4所述的方法,其特征在于,当R/S不为整数时,为第1至第N-1波任务分配系统可用的最大资源S,为第N波任务分配其所需要的资源;
当R/S为整数时,为每波任务分配系统可用的最大资源。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述作业属性为Ai包括阶段持续时间和阶段类型,且
其中,Ai为第i个作业Ji的属性,mi和ri分别为作业Ji的Map阶段和Reduce阶段的阶段持续时间,m和r分别表示作业的阶段类型为Map阶段和Reduce阶段。
7.根据权利要求6所述的方法,其特征在于,在所述根据作业属性,按照Johnson算法安排作业的执行顺序的步骤中:
将阶段类型为m的作业根据阶段持续时间由短到长的顺序排序;
将阶段类型为r的作业根据阶段持续时间由长到短的顺序排序;且
将阶段类型为m的作业排在阶段类型为r的作业之前执行。
8.根据权利要求7所述的方法,其特征在于,阶段类型相同的作业按照编号由小到大的顺序排序。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括步骤:
为每个作业编号。
10.根据权利要求6所述的方法,其特征在于,所述方法还包括步骤:
估算作业的阶段持续时间。
11.根据权利要求10所述的方法,其特征在于,所述估算作业的阶段持续时间的步骤中:
当作业请求的系统资源R等于所述系统可用的最大资源S时,根据所述作业请求的系统资源以及系统的先验信息估算所述作业的阶段持续时间。
12.根据权利要求10所述的方法,其特征在于,所述估算作业的阶段持续时间的步骤中:
当作业请求的系统资源R不等于所述系统可用的最大资源S时,根据所述作业所分配到的资源以及系统的先验信息估算所述作业的阶段持续时间。
13.一种Hadoop集群系统的调度装置,其特征在于,所述装置包括:
分配模块,用于为每个作业分配系统可用的最大资源;
排序模块,用于根据作业属性,按照Johnson算法安排作业的执行顺序;
调度模块,用于按照所述执行顺序调度作业。
14.根据权利要求13所述的装置,其特征在于,所述分配模块:
在作业请求的系统资源M等于系统可用的最大资源P时,为所述作业分配所述系统可用的最大资源P。
15.根据权利要求13所述的装置,其特征在于,所述分配模块:
在作业请求的系统资源M小于系统可用的最大资源P时,根据所述系统可用的最大资源P对所述作业分片,并为分片后的所述作业分配所述系统可用的最大资源P。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智谷睿拓技术服务有限公司,未经北京智谷睿拓技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310651432.4/1.html,转载请声明来源钻瓜专利网。