[发明专利]GPU集群资源控制系统、方法、装置、设备及存储介质在审
申请号: | 201911159666.0 | 申请日: | 2019-11-22 |
公开(公告)号: | CN111078356A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 杨明珠;张健 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455;G06F9/50 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpu 集群 资源 控制系统 方法 装置 设备 存储 介质 | ||
1.一种GPU集群资源控制系统,其特征在于,所述系统包括:
调度器以及多台物理机;
各所述物理机,被配置为安装至少一块GPU,各所述物理机中安装的GPU的卡类型相同;
所述调度器,被配置为获取待处理服务的GPU的卡类型和GPU的卡数量,根据所述待处理服务的GPU的卡类型和各所述物理机中GPU的卡类型在所述多台物理机中确定所述待处理服务的目标物理机,并根据所述待处理服务的GPU的卡数量和所述目标物理机中安装的GPU的卡数量确定处理所述待处理服务的目标GPU。
2.根据权利要求1所述的系统,其特征在于,所述调度器还被配置为接收所述待处理服务的启动信息,所述待处理服务包括多个进程,所述启动信息为各所述进程的启动信息。
3.根据权利要求2所述的系统,其特征在于,所述系统还包括:
容器,所述容器创建于各所述物理机中,所述容器用于存储所述待处理服务的启动信息,各所述物理机创建至少一个容器。
4.根据权利要求3所述的系统,其特征在于,所述调度器还被配置为确定存储所述待处理服务的启动信息的目标容器,并将所述目标容器与所述目标GPU建立关联关系。
5.根据权利要求4所述的系统,其特征在于,所述容器包括进程管理工具,所述目标容器的进程管理工具被配置为从所述目标容器中读取所述待处理服务的启动信息,依据各所述进程的启动信息,获取各所述进程对应的启动项,所述启动项为启动该进程所需要的程序,基于各所述进程的启动项,在所述目标GPU中启动各所述进程。
6.一种GPU集群资源控制方法,其特征在于,所述方法包括:
获取待处理服务的GPU的卡类型和GPU的卡数量;
根据所述待处理服务的GPU的卡类型和各物理机中GPU的卡类型在预设多台物理机中确定所述待处理服务的目标物理机,各所述物理机中安装至少一块GPU,各所述物理机中安装的GPU的卡类型相同;
根据所述待处理服务的GPU的卡数量和所述目标物理机中安装的GPU的卡数量确定处理所述待处理服务的目标GPU。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
接收所述待处理服务的启动信息,所述待处理服务包括多个进程,所述启动信息为各所述进程的启动信息。
8.一种GPU集群资源控制装置,其特征在于,所述装置包括:
采集模块,被配置为获取待处理服务的GPU的卡类型和GPU的卡数量;
第一确定模块,被配置为根据所述待处理服务的GPU的卡类型和各物理机中GPU的卡类型在预设多台物理机中确定所述待处理服务的目标物理机,各所述物理机中安装至少一块GPU,各所述物理机中安装的GPU的卡类型相同;
第二确定模块,被配置为根据所述待处理服务的GPU的卡数量和所述目标物理机中安装的GPU的卡数量确定处理所述待处理服务的目标GPU。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求6至7中任一项所述的GPU集群资源控制方法。
10.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求6至7中任一项所述的GPU集群资源控制方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911159666.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、终端、电子设备和计算机存储介质
- 下一篇:冲洗衬套及冲洗装置