[发明专利]使用光网络的可重新配置的计算平台在审
申请号: | 201980069191.8 | 申请日: | 2019-12-18 |
公开(公告)号: | CN112889032A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 尼尚特·帕蒂尔;周翔;安德鲁·斯温 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F15/173 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;邓聪惠 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 网络 重新 配置 计算 平台 | ||
方法、系统和装置,包括用于使用光网络生成计算节点的构建块集群的装置。在一个方面,方法包括接收指定用于计算工作负载的所请求计算节点的请求数据。请求数据指定计算节点的目标n维度排列。从包括每个均包括计算节点的m维度排列的构造模集合的超级平台中进行选择,所述构建块的子集在被组合时与由请求数据指定的目标排列相匹配。所述构造块集合连接到包括一个或多个光电路交换的光网络。生成包括构建块的子集的计算节点的工作负载集群。生成包括针对工作负载集群的每个维度配置用于一个或多个光电路交换的相应路由数据。
背景技术
一些计算工作负载,例如机器学习训练,需要大量的处理节点以有效地完成工作负载。处理节点可以通过互连网络彼此通信。例如,在机器学习训练中,处理节点可以彼此通信以收敛于最佳的深度学习模型。互连网络对于处理单元实现收敛的速度和效率至关重要。
随着机器学习和其他工作负载的大小和复杂性变化,包括多个处理节点的超级计算机的刚性结构可能会限制超级计算机的可用性、可伸缩性和性能。例如,如果具有连接处理节点的特定排列的刚性互连网络的超级计算机的某些处理节点发生故障,则超级计算机可能无法替换这些处理节点,从而导致可用性和性能降低。与不依赖故障节点的其他排列相比,某些特定排列也可能导致更高的性能。
发明内容
本说明书描述了与计算节点的可重配置超级平台(superpod)有关的技术,使用光网络从该可重配置超级平台中生成工作负载集群。
通常,本说明书中描述的主题的一个创新方面可以体现在以下方法中,该方法包括:接收指定用于计算工作负载的所请求计算节点的请求数据。请求数据指定所述计算节点的目标n维度排列,其中n大于或等于2。从包括每个均包括计算节点的m维度排列的构建块集合的超级平台中选择所述构建块的子集,所述构建块的子集在被组合时与由所述请求数据指定的目标n维度排列相匹配,其中m大于或等于2。所述构建块的子集连接到包括用于n维度中的每个维度的一个或多个光电路交换的光网络。生成包括所述构建块的子集的计算节点的工作负载集群。工作负载集群是专用于特定给定工作负载的计算或执行的计算节点集群。生成包括对于所述工作负载集群的每个维度,配置用于该维度的一个或多个光电路交换的相应路由数据,所述工作负载集群的每个维度的相应路由数据指定计算工作负载的数据如何沿所述工作负载集群的该维度在计算节点之间被路由。使所述工作负载集群的计算节点执行所述计算工作负载。
这些和其他实施方式可各自可选地包括以下特征中的一个或多个。在某些方面,所述请求数据指定不同类型的计算节点。选择所述构建块的子集包括针对由所述请求数据指定的每种类型的计算节点选择包括所指定的类型的一个或多个计算节点的构建块。
在一些方面,用于所述超级平台的每个维度的相应路由数据包括用于所述一个或多个光电路交换中的一个的光电路交换路由表。在一些方面,对于所述n维度中的每个维度,所述光网络包括沿着该维度在计算节点之间路由数据的所述光网络的一个或多个光电路交换。每个构建块可以包括沿着所述构建块的每个维度的计算节点的多个分段。对于每个维度的每个分段,所述光网络可以包括所述光网络的光电路交换,所述光网络的所述光电路交换在所述工作负载集群中的每个构建块的计算节点的对应分段之间路由数据。
在一些方面,每个构建块包括计算节点的三维环面或计算节点的网格中的一个。在一些方面,超级平台包括多个工作负载集群。每个工作负载集群可以包括所述构建块的不同子集,并且执行与每个其他工作负载集群不同的工作负载。
一些方面包括:接收指示所述工作负载集群的给定构建块已故障的数据,以及用可用构建块来替换所述给定构建块。用可用构建块来替换所述给定构建块可以包括更新所述光网络的一个或多个光电路交换的路由数据,以停止在所述工作负载集群的给定构建块与一个或多个其他构建块之间路由数据,以及更新所述光网络的一个或多个光电路交换的路由数据,以在所述工作负载集群的可用构建块与一个或多个其他构建块之间路由数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980069191.8/2.html,转载请声明来源钻瓜专利网。