[发明专利]机架管理系统、方法及控制器在审
申请号: | 202110458031.1 | 申请日: | 2021-04-27 |
公开(公告)号: | CN114741180A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 钱威宇 | 申请(专利权)人: | 广达电脑股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 李芳华 |
地址: | 中国台*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机架 管理 系统 方法 控制器 | ||
一种在机架中的运算装置之间分配任务的系统与方法。其中每一运算装置皆具有硬件资源,并耦接至一管理网络。一机架管理控制器监控每一运算装置的硬件资源使用率。该机架管理控制器分配任务的进行(例如运作虚拟机)至其中部分运算装置,以最大化大致上达到硬件资源完全使用的运算装置数量。该机架管理控制器将分配任务至未达硬件资源完全使用的运算装置的数量最小化。该机架管理控制器命令任何闲置运算装置最小化其功率消耗。
技术领域
本公开关于运算装置的资源管理。特定而言,本发明的各个态样关于基于硬件资源使用以管理工作分配的系统,以供一机架上的多个服务器使用。
背景技术
在高需求的应用中,使用大量的服务器(servers),例如基于网络的系统(networkbased system)或数据中心(data center)。供运算应用使用的云端(cloud)的出现,增加了对数据中心的需求。数据中心具有大量的服务器,储存数据并运行应用程序,由远程连接的计算机装置用户对其进行存取。一个典型的数据中心具有实体机架(rack)架构,并伴随电源与通信连接设备。每一机架上具有多个以网络互相连接的运算服务器。
数据中心的服务器可促成商业上的多种服务,包括执行应用程序、提供虚拟化(virtualization)服务、以及促成因特网商务(Internet commerce)。服务器一般具有基板管理控制器(baseboard management controller,BMC),管理内部运作,并处理与数据中心内的中央管理站之间的网络通信。人们可使用不同的网络以在服务器之间交换数据,以及经由管理网络交换服务器运作状态的运作数据。
一个机架通常包含多个服务器,该等服务器经由网络交换器(switch)互相通信。该等服务器为实体运算装置,然而其中每一服务器可能运行多个虚拟机(virtualmachine,VM),该等虚拟机可具有多种应用程序。这些虚拟机由网络外部观之,可视为多个分离的运算装置。虚拟机的每一应用程序皆有其对终端用户提供的特定软件服务。这些虚拟机共享该服务器的硬件资源。该等硬件资源可包括电源供应器、散热风扇、处理器核心、存储器、储存装置及输入/输出(input/output,IO)周边装置。机架上每一服务器的使用率依服务器使用模式、当前时间、用户数量等因素而定。在上述条件下,服务器的工作负载有时会来到100%的硬件使用率,有时则是50%或更少。
然而,即使该服务器运行于轻负载状态,服务器中未使用的硬件资源仍消耗电源功率,因而可能限制该机架上其他需要最大功率以达最佳效能的服务器的可用功率。当机架资源(例如电源功率)有限时,在完全使用的服务器上运行的应用程序效能可能受限,因资源被分配至使用率较低的服务器。在已知的数据中心管理方法中,系统管理员为特定工作负载用途配置一机架上的服务器。紧急的服务需求通常会导致高效的工作调度与工作负载分配难以实施。因此,已知的数据中心管理方法总是将最大资源分配在尖峰服务需求上。在此情况下,所有服务器的硬件资源使用率总是低落,因而未能对机架资源(例如服务器电源)达成高效的使用。
一般而言,最佳的电源功率效率在100%重负载使用服务器硬件资源时发生,而最低的转换效率为96%,在50%电源供应负载时发生。上述硬件资源一般包括处理器核心、系统存储器、储存控制器、以太网络(Ethernet)控制器、及输入/输出(IO)周边装置。然而,服务器的运作在一天之中未必总是处于重负载需求状态。服务器硬件资源的最大使用通常发生在特定时段,例如尖峰时段或突发事件中。由于低硬件资源使用率的服务器仍消耗功率,故任何未完全使用的服务器皆为隐形的电功率消耗者。这些服务器造成的额外功率消耗阻碍了该机架系统中现用(active,运作中)服务器的效能。除了浪费功率以外,这些额外的功率消耗可能在非现用服务器上产生潜在的硬件可修正错误(hardware correctableerror)。例如,若一个服务器处于低工作负载状态,则其硬件部件因空闲时间而处于节电状态。其CPU的缓存一致性(cache coherence)在闲置状态与现用状态之间可能无法正常同步,因而在更新与回复CPU高速缓存中的数据时造成硬件故障可修正错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广达电脑股份有限公司,未经广达电脑股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110458031.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种桂北地区油茶的高产种植方法
- 下一篇:一种抗皱化妆品及其制备方法