[发明专利]资源分配方法及设备有效
申请号: | 201711050085.4 | 申请日: | 2017-10-31 |
公开(公告)号: | CN109726008B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 张杨;冯亦挥;欧阳晋;韩巧焕;汪方 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 孙丹丹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 分配 方法 设备 | ||
本申请的目的是提供一种作业节点分配方法及设备,通过获取作业节点申请的资源量和GPU卡型号的偏好;根据各机器节点的剩余资源和GPU卡型号,为所述作业节点分配满足所述申请的资源量和GPU卡型号偏好的机器节点,实现资源调度器能够根据作业管理器对GPU卡类型的偏好和当前集群内部的机器节点剩余资源,合理的选择最恰当的GPU卡型号的机器节点进行资源分配。
技术领域
本申请涉及计算机领域,尤其涉及一种资源分配方法及设备。
背景技术
在分布式系统中,通常存在三个角色:资源调度器、作业管理器及下属作业节点、机器节点。
其中,技术术语“资源调度器”(英文全称为Resource Manager)一般是指分布式系统中协调、分配系统可用资源的服务器。
其中,技术术语“作业管理器”(英文全称为Job Master)一般是指分布式系统中控制本作业所有作业节点(Job Worker)的角色,负责代表所有作业节点向资源调度服务器申请作业资源,以及,向机器节点发送作业程序。一般地,分布式系统可以包括多个作业管理器。
其中,技术术语“机器节点”(英文全称为Machine Node)一般是指分布式系统中代表机器负责监管用户作业程序执行的角色。
其中,技术术语“作业节点”(英文全称为Job Worker)一般是指分布式系统中执行具体作业程序的角色,一般只与作业管理器通信。
当用户需要提交一个作业程序时,作业管理器会向资源调度器申请一定数量的机器资源(如CPU、内存)供作业节点使用;资源调度器在收到作业资源申请后,会根据分布式系统中剩余的可用资源计算出可以分配给作业管理器可用资源列表,资源列表中包括可用的机器节点及其对应的分配的可用资源量,例如在A机器上可用1核CPU、1GB内存,在B机器上可用2核CPU、2GB内存;然后,资源调度器会将资源列表发送给作业管理器和相应机器节点。作业管理器在收到资源(Resource)列表后,会将作业节点中的作业程序分配到相应的机器节点执行。当作业节点执行完毕时,作业管理器会告知资源管理器归还该作业节点的资源,资源管理器收到归还申请后通知机器节点释放掉该作业节点的资源,此释放资源可再次分配给其他作业。
目前随着大数据在各行各业的飞速发展,越来越多的机器学习程序被应用到分布式系统中。机器学习程序会涉及大量的卷积运算和矩阵运算的组合,而卷积运算通过一定的数学手段也可以通过矩阵运算完成。如果使用CPU进行计算,由于处理这些计算往往非常耗时,会占用了CPU的一大部分时间。而CPU还要处理计算机器许多其他任务,则会进一步降低程序的执行速度。GPU全称叫做graphics processing unit(图形处理器),是专门为了图像渲染设计的,渲染这个过程具体来说就是矩阵的运算,所以GPU天生就是为了运行矩阵运算而诞生的,它对矩阵运算有特殊的硬件优化,执行速度比CPU要快。此外,一般的GPU有几千个执行子核心,可以独立并发执行多个矩阵运算,而在CPU内程序执行是串行的。综合来看,在机器学习的程序中,使用GPU的执行速度要远远高于使用CPU。
而随着GPU硬件的快速发展,一个GPU集群中可能会存在不同型号的GPU卡型号,比如,在刚开始搭建集群的时候,采购的是同一批次的GPU卡型号;过了半年,GPU厂商推出了新的GPU卡型号,那么集群管理者可能会采购新的GPU机器添加到原有集群中,如图1所示,图1中的M40\K40\P40表示机器上GPU卡的型号,不同GPU卡型号型号之间的性能差异比较明显,相邻两代的GPU卡性能一般有2倍左右的差异。假设GPU卡速度M40<K40<P40。
在GPU卡型号混布的集群中,通常对调度有如下需求:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711050085.4/2.html,转载请声明来源钻瓜专利网。