[发明专利]超级计算机中基于PCI Express总线的多GPU供电控制装置及方法在审

专利信息
申请号: 201510409049.7 申请日: 2015-07-13
公开(公告)号: CN105005373A 公开(公告)日: 2015-10-28
发明(设计)人: 赵地 申请(专利权)人: 中国科学院计算机网络信息中心
主分类号: G06F1/26 分类号: G06F1/26
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 任岩
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 超级 计算机 基于 pci express 总线 gpu 供电 控制 装置 方法
【说明书】:

技术领域

发明涉及超级计算机的多GPU节点耗电管理的技术领域,具体涉及在超级计算机的GPU节点内,一种基于PCI Express总线的多GPU的供电控制装置及方法。

背景技术

GPU是图形加速卡(Graphics Processing Unit)的简称,是提高计算机处理大量图像或大规模计算的加速卡。现代GPU大多基于PCI Express总线,而PCI Express总线是从2001年春季开始发展起来的总线接口。现代GPU的主要生产商包括美国英伟达(NVIDIA)公司和美国AMD公司。

超级计算机的多GPU节点(multi-GPU node)是含有两个或两个以上的GPU的服务器。在此发明中,超级计算机的多GPU节点(multi-GPU node)的两个或两个以上的GPU是指同型号的GPU。现有的多GPU技术包括美国NVIDIA公司开发出的SLI技术和美国AMD公司开发出的CrossFireX技术。

现有超级计算机的GPU节点(multi-GPU node)能够提供几十T级别的浮点计算能力,在商业计算和科学计算领域,比如计算金融学,计算机辅助设计,图像处理,动画设计等领域有着广泛的应用。在使用多用户软件比如Linux的情况下,超级计算机的多GPU节点(multi-GPU node)在系统负荷内也提供一定的多用户使用的能力。

现在多家公司开发的超级计算机的多GPU节点(multi-GPU node)产品,比如中科曙光,超微(Supermicro),等公司。这些公司开发的超级计算机的GPU节点都具有耗电管理的功能。比如NVIDIA公司的NVIDIA Management Library(包括NVIDIA-smi和NVIDIA-healthmon)和超微(Supermicro)公司的Supermicro Power Manager。

PCI Express总线包含供电针脚和信号针脚两个部分。单GPU能在软件的控制下进入空闲(idle)状态。此时,单GPU处于最低功率,存在一定的耗电。本发明采用CMOS模拟开关(analog switch)对单GPU进行完全控制,使单GPU能够处于彻底的“开启”或“关闭”的状态。然而,即使多个GPU同时处于空闲(idle)状态,因为单GPU的空闲(idle)状态存在耗电,超级计算机的多GPU节点的耗电仍然不小。例如,在工作状态下,四NVIDIA TITAN的工作站的峰值功率约有几千瓦特;在空闲(idle)状态下,其功率仍然在百瓦特以上。

因此,对于长期使用超级计算机的多GPU节点的用户,或者对于超级计算机的多GPU节点耗能比较敏感的用户,需要一种更为有效的供电控制装置及方法。

发明内容

(一)要解决的技术问题

本发明的目的在于,提供一种基于PCI Express总线的多GPU的供电控制装置及方法,解决超级计算机的多GPU节点在空闲状态下的能耗问题,使GPU在空闲状态下的能耗为0。

(二)技术方案

本发明提供一种基于PCI Express总线的多GPU的供电控制装置,包括多个耗电管理接口及多个控制开关,其中:

每个GPU对应有一个耗电管理接口及一个控制开关,GPU通过其对应的耗电管理接口与PCI Express总线连接,该GPU对应的控制开关电连接于耗电管理接口,用于控制GPU与PCI Express总线之间的通断电。

本发明还提供一种基于PCI Express总线的多GPU的供电控制方法,包括以下步骤:

S1,检测多个GPU的工作状态;

S2,当检测到某一GPU没有运算负载时,且该GPU是通电的,则关闭该GPU对应的控制开关,使该GPU与PCI Express总线之间断电;当检测到某一GPU有运算负载时,且该GPU是断电的,则开启该GPU对应的控制开关,使该GPU与PCI Express总线之间通电。

(三)有益效果

本发明提供的多GPU的供电控制装置及方法,采用CMOS模拟开关(analog switch)对单GPU进行完全控制,使单GPU能够处于彻底的“开启”或“关闭”的状态,能在空闲状态彻底使GPU断电,使GPU能耗为0。

附图说明

图1是本发明实施例中多GPU的供电控制装置的示意图。

图2是本发明实施例中耗电管理接口的结构图。

图3是本发明实施例中控制开关的示意图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510409049.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top