[发明专利]用于监控服务器基础设施的健康状况的方法和系统在审
申请号: | 202010363746.4 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111858230A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 莫尔万·勒戈夫;拉斐尔·格隆;西尔万·舍诺;亚历克西·奥特雷 | 申请(专利权)人: | OVH公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;杨林森 |
地址: | 法国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 监控 服务器 基础设施 健康状况 方法 系统 | ||
本发明提供了一种用于监控服务器基础设施的健康状况的方法和系统。可以通过在连续轮询周期中的每一个处从轮询节点向服务器基础设施中的服务器发送测量请求来监控服务器基础设施的健康状况。响应于测量请求,将从服务器接收的测量结果存储在数据库中。使用存储在数据库中的累积测量结果来训练机器学习系统,以构建服务器的预测模型。评估从服务器接收的最新测量结果与服务器的预测模型的符合性。如果最新测量结果不符合服务器的预测模型,则采取校正动作。可以对从一组服务器接收的测量结果进行聚合,并且机器学习系统可以构建该组服务器的预测模型。可以针对该组服务器来评估与预测模型的符合性。
技术领域
本技术涉及数据处理系统领域。特别地,涉及用于监控服务器基础设施的健康状况的系统和方法。
背景技术
数据中心和云基础设施集成了许多服务器以向大量客户端提供相互托管服务。数据中心可以包括数十万的服务器并且为它们的客户端托管数百万个域。服务器被组装在机架中,多个机架被安装在房间中。大型数据中心可能包括多个这样的房间。任何给定的服务器都可以专用于特定客户端,并且可以包括安装在服务器的主板上的也被称为中央处理单元(CPU)的一个或更多个处理器。
来自客户端的服务需求通常会随着时间而变化,并且变化可能有时非常强烈。数据中心的健康状况被监测,以便优化其性能以满足客户端期望的服务质量。可以监测的数据中心的服务器的一个特定参数是其处理器的温度。对服务器的大量需求引起其处理器上的负荷的增加,并且通常导致处理器的温度的增加。可能影响特定处理器的温度的其他因素包括:安装有特定处理器的机架的通常温度;安装机架的房间的环境温度;为安装在机架中的多个处理器提供冷却的冷却系统的状况;以及安装该特定处理器的数据中心的通常环境状况。特别是当电源电压超出建议的处理器的电源电压范围时,可能影响特定处理器的温度和寿命的另一因素包括电源电压。可以被监测以维持服务器的性能和寿命的数据中心的服务器的其他参数包括例如安装在主板上的其他部件诸如芯片组、存储装置、网络接口部件和硬件驱动器的温度和/或电压。
大型数据中心通常配备有大容量的空气强制冷却系统。法国鲁贝(Roubaix,France)的OVH最近用更高效的水冷却系统来代替或补充空气强制冷却系统。在某些应用中,处理器物理上安装在水冷却装置上,水冷却装置被馈送有被提供给数据中心的若干机架的水流。
无论是使用空气强制冷却、水冷却还是这二者的结合来控制机架中的处理器的温度,都可能发生处理器的过热。过热可能例如是由冷却系统的故障或冷却系统的部件之一的故障、鉴于数据中心的实际需求而缺乏冷却能力、至服务器的异常电源电压以及其他原因引起的。向服务器提供异常的电源电压也可能引起服务器的硬件部件的寿命的缩短。当高温阈值被超过时,可以立即采取诸如自动节流或服务器的紧急关闭的行动。当某些软件特征由于节流而暂时被禁用时或者当在没有提前警告的情况下关闭服务器时,预期会给向客户端提供服务带来负面影响。因此,使得能够预测过热和可能不利于服务提供的其他情况的预防措施将是优选的。
由于各种运营、商业和法律方面的考虑,监测数据中心或云基础设施中大量服务器的健康状况变得更加复杂。首先,用于监测服务器的温度和其他操作参数的常规技术可能例如通过向其处理器增加更多要求而影响服务器的性能。其次,数据中心的服务器可能并不完全相同。而是,数据中心可以包括具有不同硬件和/或软件结构的各种各样的服务器。第三,客户端通常希望保持其信息的机密性。因此,在没有被提供对运行在服务器上的操作系统的访问的情况下,数据中心的操作者被要求监测服务器的健康状况。最后,操作者必须遵守有关数据保护和隐私的法律要求,例如通用数据保护条例(GDPR)的法律要求。当服务器不再服务于客户端并且被分配给新客户端时,与先前客户端相关的性能监测数据将无法用于新客户端。
即使以上确定的最新发展可以提供益处,但是仍然期望改进。
背景技术章节中讨论的主题不应仅仅因为在背景技术章节中被提及而被认为是现有技术。类似地,在背景技术章节中提及的问题或与背景技术章节的主题相关联的问题不应被认为先前在现有技术中已经被认识到。背景技术章节中的主题仅表示不同的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OVH公司,未经OVH公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010363746.4/2.html,转载请声明来源钻瓜专利网。