[发明专利]功率管理方法和设备在审
申请号: | 201980099695.4 | 申请日: | 2019-09-27 |
公开(公告)号: | CN114503055A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 宋军;靳玲玲;程霖;卢毅军;奉有泉;孟晓林;朱昊 | 申请(专利权)人: | 阿里云计算有限公司 |
主分类号: | G06F1/26 | 分类号: | G06F1/26 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 功率 管理 方法 设备 | ||
提供了用于改进功率管理的方法和设备。一种功率管理组件接收计算系统的功率封顶命令。所述计算系统包括多个处理组件。所述计算系统包括分布在多个处理组件当中的多个功率域。所述功率管理组件将在第一组功率域上运行的一个或多个实例合并到第二组功率域上。所述功率管理组件对所述计算系统中排除所述第二组功率域的所述多个功率域执行功率封顶。
技术领域
本公开涉及功率管理的领域,并且更具体地,涉及用于计算系统的功率管理的方法和设备。
背景技术
功率封顶是现代数据中心(DC)中广泛地用于提高机架上服务器部署密度并避免停电的技术。然而,在由供应商提供的硬件和固件所支持的功率封顶期间,由于功率封顶,不同类型的处理组件(例如CPU和GPU)的性能一致地降低了。因此,高优先级的实例/应用的性能在功率封顶期间可能受到负面影响。
通常,CPU制造商和GPU制造商给CPU和GPU提供功率封顶能力。然而,由制造商提供的功率封顶控制逻辑简单地使整个系统的功耗节流,直到达到功率封顶目标为止。然而,制造商未考虑到在系统上运行的性能重要的实例/应用由于功率封顶而受到影响。
当前,GPU服务器是昂贵的,并且性能重要的实例/应用如在其上运行的AI训练和推理作业是重要的。因此,云服务提供商不想GPU服务器的性能降级。另一方面,GPU服务器的功耗高。例如,可以将8卡GPU服务器的热设计功率(TDP)定额在3000W。高TDP使得难以将GPU服务器装配到功率紧凑机架中而不增加跳闸风险。因此,从互联网数据中心(IDC)的总拥有成本(TCO)的成本优化的角度来看,功率封顶是必要的。因此,出现困境—不能使由GPU服务器运行的性能重要的实例/应用慢下来,然而IDC需要使用功率封顶来降低成本并避免跳闸风险。
因此,期望在不显著地损害性能重要的实例/应用的情况下对计算系统执行功率封顶。
发明内容
本发明内容不旨在标识所要求保护的主题的必要特征,也不意在供在限制所要求保护的主题的范围时使用。
下文描述功率管理方法和设备的示例实现方式。在实现方式中,功率管理组件接收计算系统的功率封顶命令。计算系统包括多个处理组件。计算系统包括分布在多个处理组件当中的多个功率域。功率管理组件将在第一组功率域上运行的一个或多个实例合并到第二组功率域上。功率管理组件基于功率域的类型不同地执行功率封顶。第二组功率域是重要功率域,然而其他功率域是非重要功率域。在实现方式中,功率管理组件对非重要功率域执行功率封顶而不对重要功率域执行功率封顶。附加地或可替代地,功率管理组件对非重要功率域执行第一功率封顶过程而对重要功率域执行第二功率封顶过程,其中第二功率封顶过程对重要功率域的性能的影响小于第一功率封顶过程对非重要功率域的性能的影响。
在合并之后,可以不同地管理重要功率域和非重要功率域的功耗。在功率封顶期间,性能重要的实例/应用在其上运行的重要功率域的性能可以不经历降级或比非重要功率域降级更少。因为重要功率域的性能被保证,所以能够降低功率封顶对计算系统的整体性能的影响。因此,减轻了功率封顶期间的性能影响。
附图说明
参考附图阐述详细描述。在各图中,附图标记的最左边数字标识附图标记首次出现在其中的图。在不同的图中使用相同的附图标记指示类似或相同的项目或特征。
图1A图示计算系统的示例框图。
图1B图示合并/组合之后的计算系统的示例框图。
图2图示用于在计算系统中合并/组合性能重要的实例/应用的过程的示例流程图。
图3A图示处于初始状态的计算系统的示例框图。
图3B图示合并/组合之后的计算系统的示例框图。
图4图示用于合并/组合性能重要的实例/应用并且基于重要功率域和非重要功率域执行功率封顶的过程的示例流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980099695.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于焊接至少两个部件的焊接设备及方法
- 下一篇:弹性箔片推力轴承