[发明专利]超级计算机中基于PCI Express总线的多GPU供电控制装置及方法在审
申请号: | 201510409049.7 | 申请日: | 2015-07-13 |
公开(公告)号: | CN105005373A | 公开(公告)日: | 2015-10-28 |
发明(设计)人: | 赵地 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F1/26 | 分类号: | G06F1/26 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 超级 计算机 基于 pci express 总线 gpu 供电 控制 装置 方法 | ||
技术领域
本发明涉及超级计算机的多GPU节点耗电管理的技术领域,具体涉及在超级计算机的GPU节点内,一种基于PCI Express总线的多GPU的供电控制装置及方法。
背景技术
GPU是图形加速卡(Graphics Processing Unit)的简称,是提高计算机处理大量图像或大规模计算的加速卡。现代GPU大多基于PCI Express总线,而PCI Express总线是从2001年春季开始发展起来的总线接口。现代GPU的主要生产商包括美国英伟达(NVIDIA)公司和美国AMD公司。
超级计算机的多GPU节点(multi-GPU node)是含有两个或两个以上的GPU的服务器。在此发明中,超级计算机的多GPU节点(multi-GPU node)的两个或两个以上的GPU是指同型号的GPU。现有的多GPU技术包括美国NVIDIA公司开发出的SLI技术和美国AMD公司开发出的CrossFireX技术。
现有超级计算机的GPU节点(multi-GPU node)能够提供几十T级别的浮点计算能力,在商业计算和科学计算领域,比如计算金融学,计算机辅助设计,图像处理,动画设计等领域有着广泛的应用。在使用多用户软件比如Linux的情况下,超级计算机的多GPU节点(multi-GPU node)在系统负荷内也提供一定的多用户使用的能力。
现在多家公司开发的超级计算机的多GPU节点(multi-GPU node)产品,比如中科曙光,超微(Supermicro),等公司。这些公司开发的超级计算机的GPU节点都具有耗电管理的功能。比如NVIDIA公司的NVIDIA Management Library(包括NVIDIA-smi和NVIDIA-healthmon)和超微(Supermicro)公司的Supermicro Power Manager。
PCI Express总线包含供电针脚和信号针脚两个部分。单GPU能在软件的控制下进入空闲(idle)状态。此时,单GPU处于最低功率,存在一定的耗电。本发明采用CMOS模拟开关(analog switch)对单GPU进行完全控制,使单GPU能够处于彻底的“开启”或“关闭”的状态。然而,即使多个GPU同时处于空闲(idle)状态,因为单GPU的空闲(idle)状态存在耗电,超级计算机的多GPU节点的耗电仍然不小。例如,在工作状态下,四NVIDIA TITAN的工作站的峰值功率约有几千瓦特;在空闲(idle)状态下,其功率仍然在百瓦特以上。
因此,对于长期使用超级计算机的多GPU节点的用户,或者对于超级计算机的多GPU节点耗能比较敏感的用户,需要一种更为有效的供电控制装置及方法。
发明内容
(一)要解决的技术问题
本发明的目的在于,提供一种基于PCI Express总线的多GPU的供电控制装置及方法,解决超级计算机的多GPU节点在空闲状态下的能耗问题,使GPU在空闲状态下的能耗为0。
(二)技术方案
本发明提供一种基于PCI Express总线的多GPU的供电控制装置,包括多个耗电管理接口及多个控制开关,其中:
每个GPU对应有一个耗电管理接口及一个控制开关,GPU通过其对应的耗电管理接口与PCI Express总线连接,该GPU对应的控制开关电连接于耗电管理接口,用于控制GPU与PCI Express总线之间的通断电。
本发明还提供一种基于PCI Express总线的多GPU的供电控制方法,包括以下步骤:
S1,检测多个GPU的工作状态;
S2,当检测到某一GPU没有运算负载时,且该GPU是通电的,则关闭该GPU对应的控制开关,使该GPU与PCI Express总线之间断电;当检测到某一GPU有运算负载时,且该GPU是断电的,则开启该GPU对应的控制开关,使该GPU与PCI Express总线之间通电。
(三)有益效果
本发明提供的多GPU的供电控制装置及方法,采用CMOS模拟开关(analog switch)对单GPU进行完全控制,使单GPU能够处于彻底的“开启”或“关闭”的状态,能在空闲状态彻底使GPU断电,使GPU能耗为0。
附图说明
图1是本发明实施例中多GPU的供电控制装置的示意图。
图2是本发明实施例中耗电管理接口的结构图。
图3是本发明实施例中控制开关的示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510409049.7/2.html,转载请声明来源钻瓜专利网。