[发明专利]一种基于Hadoop多作业环境下的资源调度方法有效

专利信息
申请号: 201510297019.1 申请日: 2015-06-03
公开(公告)号: CN104915407B 公开(公告)日: 2018-06-12
发明(设计)人: 王芳;冯丹;杨静怡;潘佳艺;周俊 申请(专利权)人: 华中科技大学
主分类号: G06F17/30 分类号: G06F17/30;G06F9/48;G06F11/14
代理公司: 华中科技大学专利中心 42201 代理人: 曹葆青
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于Hadoop多作业环境下的资源调度方法,包括:(1)实时采集集群负载、Hadoop平台以及硬件三方监控信息,(2)实时采集集群各计算节点上用户的作业执行监控信息,(3)汇总集群三方监控数据,建模评估节点的计算能力,并将集群节点划分为优势计算节点和劣势计算节点,(4)若节点为优势计算节点,则启动基于相似度评估的作业任务资源需求配置策略,(5)若节点为劣势计算节点,则还原为Yarn默认的资源需求配置策略。本发明解决了Yarn现有资源调度器中任务资源需求划分粒度过大导致的资源碎片问题,能够综合考虑集群节点和作业的异构性,通过合理、有效地分配节点资源增加集群执行并发度,从而提高Hadoop集群多作业的执行效率。
搜索关键词: 计算节点 集群 任务资源需求 集群节点 监控信息 配置策略 实时采集 资源调度 作业环境 相似度评估 有效地分配 资源调度器 计算能力 监控数据 节点资源 评估节点 资源碎片 资源需求 综合考虑 作业执行 并发度 异构性 建模 还原
【主权项】:
一种基于Hadoop多作业环境下的资源调度方法,其特征在于,包括以下步骤:(1)实时采集集群负载、Hadoop平台以及硬件三方监控信息,并按照数据采集的先后顺序进行存储,生成三方监控输出反馈文件;(2)实时采集集群各计算节点上用户的作业执行监控信息,生成作业执行监控输出反馈文件;(3)汇总、解析步骤(1)中得出的三方监控输出反馈文件,建模评估节点的计算能力,并根据计算能力评分的高低将集群计算节点划分为优势计算节点和劣势计算节点;(4)若节点为优势计算节点,则根据步骤(2)中得出的作业执行监控输出反馈文件启动基于相似度评估的作业任务资源需求配置策略;(5)若节点为劣势计算节点,则还原为Yarn默认的资源需求配置策略;所述步骤(3)包括以下子步骤:(3‑1)汇总、解析步骤(1)中得出的三方监控输出反馈文件,在线建模计算节点的计算能力评分,具体采用以下公式:<mrow><mi>t</mi><mo>=</mo><msub><mi>F</mi><mi>J</mi></msub><mrow><mo>(</mo><mover><mrow><mi>l</mi><mi>l</mi></mrow><mo>&RightArrow;</mo></mover><mo>,</mo><mover><mrow><mi>p</mi><mi>w</mi></mrow><mo>&RightArrow;</mo></mover><mo>,</mo><mover><mrow><mi>h</mi><mi>w</mi></mrow><mo>&RightArrow;</mo></mover><mo>)</mo></mrow></mrow><mrow><mover><mrow><mi>p</mi><mi>w</mi></mrow><mo>&RightArrow;</mo></mover><mo>=</mo><mrow><mo>(</mo><mi>s</mi><mi>u</mi><mi>c</mi><mo>,</mo><mi>w</mi><mi>a</mi><mi>i</mi><mi>t</mi><mo>_</mo><mi>t</mi><mi>i</mi><mi>m</mi><mi>e</mi><mo>,</mo><mi>r</mi><mi>e</mi><mi>s</mi><mi>p</mi><mi>o</mi><mi>n</mi><mi>s</mi><mi>e</mi><mo>_</mo><mi>t</mi><mi>i</mi><mi>m</mi><mi>e</mi><mo>)</mo></mrow></mrow><mrow><mover><mrow><mi>h</mi><mi>w</mi></mrow><mo>&RightArrow;</mo></mover><mo>=</mo><mrow><mo>(</mo><mi>c</mi><mi>p</mi><mi>u</mi><mo>_</mo><mi>u</mi><mi>t</mi><mi>i</mi><mi>l</mi><mo>,</mo><mi>i</mi><mi>o</mi><mo>_</mo><mi>u</mi><mi>t</mi><mi>i</mi><mi>l</mi><mo>,</mo><mi>m</mi><mi>e</mi><mi>m</mi><mo>_</mo><mi>u</mi><mi>t</mi><mi>i</mi><mi>l</mi><mo>,</mo><mi>n</mi><mi>e</mi><mi>t</mi><mo>_</mo><mi>u</mi><mi>t</mi><mi>i</mi><mi>l</mi><mo>)</mo></mrow></mrow>其中,t表示计算节点的计算能力评分,表示集群在当前监控周期下负载信息,表示在当前监控周期下自定义的Hadoop平台监控信息,suc表示计算节点执行任务的成功率,wait_time表示在该计算节点投放新任务的平均等待时间,response_time表示节点上任务执行的平均响应时间,表示在当前监控周期下节点的硬件监控信息,cpu_util、io_util、mem_util、net_util分别表示计算节点上cpu、磁盘、内存和网络的平均利用率,FJ则是节点计算能力评分t关于三个变量的一个复杂函数;(3‑2)采用排序函数对节点计算能力评分t按照从高到低的顺序进行重新排列,形成计算节点主机名、监控周期序列号和计算能力评分三者之间的映射关系,具体通过以下键值对表示:(键,值)=((Host,Monitor_Id),t)其中,Host表示计算节点主机名,Monitor_Id表示节点所在监控周期的序列号,t表示建模得出的节点计算能力评分;(3‑3)计算集群节点计算能力评分均值at,具体公式如下:<mrow><mi>a</mi><mi>t</mi><mo>=</mo><mfrac><mrow><munderover><mo>&Sigma;</mo><mrow><mi>z</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>t</mi><mi>z</mi></msub></mrow><mi>N</mi></mfrac></mrow>其中,tz表示计算节点z的计算能力评分,N表示集群计算节点总个数;(3‑4)将排序后的前K个节点判定为集群的优势计算节点,后(N‑K)个节点判定为劣势计算节点,其中,N表示当前集群所有节点个数,K表示集群中计算能力评分高于(β*at)的计算节点个数,β取经验值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510297019.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top