[发明专利]一种面向GPU集群的资源管理方法和系统有效
申请号: | 201310284684.8 | 申请日: | 2013-07-08 |
公开(公告)号: | CN103365726A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 金海;郑然;冯晓文;朱磊 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向GPU集群的资源管理方法,包括:主管理节点建立两张表:资源信息表和任务信息表;主管理节点接收到新任务;判断任务是CPU任务还是GPU任务;主管理节点查找满足任务需求的空闲资源;对于CPU任务,次管理节点对任务的数据进行预处理,将数据片分发到其管理的所有节点进行计算,计算完成后,主管理节点根据任务号回收次管理节点管理的所有节点的相关CPU资源;对于GPU任务,在检测到GPU计算完成后,主管理节点先根据任务号回收次管理节点管理的所有节点的相关GPU资源;同时次管理节点管理的所有节点中的CPU进行计算结果后处理,后处理完成后。本发明将CPU资源和GPU资源区别对待,通过任务的检测,能快速地回收空闲的GPU资源。 | ||
搜索关键词: | 一种 面向 gpu 集群 资源管理 方法 系统 | ||
【主权项】:
一种面向GPU集群的资源管理方法,其特征在于,包括以下步骤: (1)主管理节点建立资源信息表和任务信息表,其中资源信息表记录集群中每个节点的节点编号、CPU数目、空闲CPU数目、GPU数目、空闲GPU数目。任务信息表记录正在运行的任务的任务号、占用的资源列表; (2)主管理节点接收来自用户的新任务; (3)主管理节点通过资源信息表判断是否有空闲资源满足该任务的需求;若是则转入步骤(5),否则转入步骤(4); (4)主管理节点将该任务放入排队队列,然后返回步骤(2); (5)主管理节点将该任务分配到节点编号最小的节点,将该节点设为次管理节点,并更新资源信息表和任务信息表; (6)次管理节点对该任务的数据进行处理,以获得该任务的计算结果; (7)次管理节点判断该任务是CPU任务还是GPU任务;若是CPU任务则转入步骤(8),若是GPU任务则转入步骤(10); (8)次管理节点向主管理节点发送该CPU任务的任务号和CPU完成信息; (9)主管理节点根据来自次管理节点的任务号,回收该次管理节点管理的所有节点的CPU资源,更新资源信息表和任务信息表,然后过程结束; (10)次管理节点根据该GPU任务的任务号,回收该次管理节点管理的所有节点的GPU资源,同时次管理节点管理的所有节点中的CPU对数据块的计算结果进行后处理; (11)主管理节点根据来自次管理节点的任务号,回收该次管理节点管理的所有节点的GPU资源,更新资源信息表; (12)次管理节点向主管理节点发送该GPU任务的任务号和CPU完成信息,然后转入步骤(9)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310284684.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种撑杆可拆卸式婴儿床
- 下一篇:一种电气工程用地下电缆沟施工结构