[发明专利]云端混合加速器的调度方法、计算机设备及存储介质在审
申请号: | 202310600324.8 | 申请日: | 2023-05-25 |
公开(公告)号: | CN116627645A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 彭信民;李翔;叶永青;李华毅 | 申请(专利权)人: | 上海燧原科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 倪焱 |
地址: | 201306 上海市浦东新区中国(上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 云端 混合 加速器 调度 方法 计算机 设备 存储 介质 | ||
本发明公开了一种云端混合加速器的调度方法、计算机设备及存储介质,涉及人工智能技术。该方法包括:接收客户端发送的模型并行值;根据模型并行值和异构的加速器资源确定环境变量;根据环境变量确定加速器拓扑信息;根据拓扑信息和环境变量调度加速器执行模型训练任务。能够根据客户端发送的模型并行值,计算异构加速器场景中加速器使用的环境变量,根据环境变量确定异构场景的加速器拓扑信息,根据该拓扑信息和环境变量调度异构的AI加速器执行AI模型训练,进而实现多个代际的AI加速器联合执行AI模型训练任务,提高AI加速器的使用率。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种云端混合加速器的调度方法、计算机设备及存储介质。
背景技术
随着人工智能技术的发展,衍生出云端AI训练。借助云端服务器的高算力为用户提供AI模型训练。云端服务器中包含AI加速器,可以通过AI加速器完成AI模型的训练。
随着AI加速器的换代升级,出现多个代际的AI加速器。AI模型的训练通常选择同一代际的加速器,导致替换下来的AI加速器使用率下降。如何提高AI加速器的使用率成为亟待解决的问题。
发明内容
本发明提供一种云端混合加速器的调度方法、计算机设备及存储介质,以实现提高异构加速器的使用率。
第一方面,本发明实施例提供了一种云端混合加速器的调度方法,包括:
接收客户端发送的模型并行值;
根据所述模型并行值和异构的加速器资源确定环境变量;
根据所述环境变量确定加速器拓扑信息;
根据所述拓扑信息和所述环境变量调度加速器执行模型训练任务。
第二方面,本发明实施例还提供了一种云端混合加速器的调度方装置,包括:
云端混合加速器的调度方装置,包括:
接收模块,用于接收客户端发送的模型并行值;
环境变量确定模块,用于根据所述模型并行值和异构的加速器资源确定环境变量;
拓扑信息确定模块,用于根据所述环境变量确定加速器拓扑信息;
模型训练模块,用于根据所述拓扑信息和所述环境变量调度加速器执行模型训练任务。
第三方面,本发明实施例还提供了一种芯片,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如本发明实施例所示的云端混合加速器的调度方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例所示的云端混合加速器的调度方法。
本发明实施例提供的云端混合加速器的调度方法,接收客户端发送的模型并行值;根据所述模型并行值和异构的加速器资源确定环境变量;根据所述环境变量确定加速器拓扑信息;根据所述拓扑信息和所述环境变量调度加速器执行模型训练任务。相对于目前只能使用同一代际的AI加速器,无法使用多个代际的AI加速器完成AI模型训练任务,AI加速器整体使用率低的情况,本发明实施例提供的云端混合加速器的调度方法,能够根据客户端发送的模型并行值,计算异构加速器场景中加速器使用的环境变量,根据环境变量确定异构场景的加速器拓扑信息,根据该拓扑信息和环境变量调度异构的AI加速器执行AI模型训练,进而实现多个代际的AI加速器联合执行AI模型训练任务,提高AI加速器的使用率。
附图说明
图1是本发明实施例中的异构资源调度系统架构示意图。
图2是本发明实施例一中的云端混合加速器的调度方法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海燧原科技有限公司,未经上海燧原科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310600324.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能行车系统
- 下一篇:一种用于蚕养殖的病原检测装置及检测方法