[发明专利]一种GPU任务的调配方法、装置、设备和介质在审

专利信息
申请号: 202211181907.3 申请日: 2022-09-27
公开(公告)号: CN115794370A 公开(公告)日: 2023-03-14
发明(设计)人: 黎伟杰 申请(专利权)人: 广州文远知行科技有限公司
主分类号: G06F9/50 分类号: G06F9/50;G06F11/30
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 石翰林
地址: 510000 广东省广州市黄埔区广州国际生物岛螺旋*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 gpu 任务 调配 方法 装置 设备 介质
【说明书】:

发明公开了一种GPU任务的调配方法、装置、设备和介质,当全局调度器接收到GPU任务时,获取该GPU任务对应的GPU需求数量,并从API服务器获取各个集群节点分别对应的可用资源信息,进一步基于GPU需求数量匹配可用资源信息,以从多个集群节点中筛选至少一个候选节点,并生成与其对应的GPU可用列表,若候选节点的数量不少于两个,则发送该GPU可用列表至GPU监控服务器以获取到多个目标连接矩阵,根据各个目标连接矩阵内的GPU组合在环形通讯链路的比对结果,从候选节点选取决策节点,将GPU任务分配至该决策节点执行GPU任务。从而按照GPU任务的需求实现节点的最优化分配,有效提高GPU任务的执行效率。

技术领域

本发明涉及资源分配技术领域,尤其涉及一种GPU任务的调配方法、装置、设备和介质。

背景技术

随着社会发展,为了进一步解决人力成本,提升物流、运输效率,在越来越多的领域中投入了自动驾驶车辆的使用。

对于自动驾驶车辆而言,其行驶安全性作为首要考虑的因素之一,需要对自动驾驶车辆的各个功能进行不断的测试以尽可能提高其行驶安全性,通常自动驾驶车辆通过多次路测的方式实现。由于路测的成本较高,且存在部分功能无法通过单次路测进行检测,为此可以通过Kubernetes集群内的虚拟化设备实现对自动驾驶车辆的模拟测试。

而随着自动驾驶车辆内的深度学习模型的规模越来越大,往往需要多个图形处理器(graphics processing unit,GPU)进行模型的协同训练。但现有的Kubernetes集群在注册GPU资源时,通常是统一标记为GPU资源,难以按照各类任务进行GPU资源的最优化分配,对GPU资源的利用率较低。

发明内容

本发明提供了一种GPU任务的调配方法、装置、设备和介质,解决了现有的Kubernetes集群在注册GPU资源时,通常是统一标记为GPU资源,难以按照各类任务进行GPU资源的最优化分配,对GPU资源的利用率较低的技术问题。

本发明第一方面提供的一种GPU任务的调配方法,应用于资源集群内的全局调度器,所述全局调度器、API服务器和GPU监控服务器两两之间通信连接,所述资源集群包括多个集群节点,所述方法包括:

当接收到GPU任务时,获取所述GPU任务内的GPU需求数量并从所述API服务器获取各个所述集群节点对应的可用资源信息;

根据所述GPU需求数量和各所述可用资源信息,从多个所述集群节点中筛选至少一个候选节点并生成对应的GPU可用列表;

当所述候选节点的数量不少于两个时,发送所述GPU可用列表至所述GPU监控服务器;

当接收到所述GPU监控服务器响应所述GPU可用列表返回的多个目标连接矩阵时,根据各所述目标连接矩阵从多个所述候选节点选取决策节点;

将所述GPU任务分配至所述决策节点,并通过所述决策节点执行所述GPU任务。

可选地,所述集群节点包括资源插件和多个待判定GPU;所述方法还包括:

通过所述资源插件从多个所述待判定GPU获取各可用GPU对应的唯一设备标识;

通过所述资源插件采用所述唯一设备标识和所述集群节点对应的节点标识,构建可用资源信息并上传至所述API服务器;

通过所述资源插件遍历所述可用GPU,构建连接矩阵并上传至所述GPU监控服务器。

可选地,所述通过所述资源插件遍历所述可用GPU,构建连接矩阵并上传至所述GPU监控服务器的步骤,包括:

通过所述资源插件遍历所述可用GPU,确定所述可用GPU两两之间的多个初始链路信息;

选取链路级别最高的初始链路信息作为所述可用GPU的目标链路信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州文远知行科技有限公司,未经广州文远知行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211181907.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top