[发明专利]一种基于告警分析的服务器管理方法、装置在审
申请号: | 202011148684.1 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112486757A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 李东轩 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32;H04L12/24 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 李舜江 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 告警 分析 服务器管理 方法 装置 | ||
本发明提供一种基于告警分析的服务器管理方法、装置,所述方法包括如下步骤:扫描整个数据中心的节点,获取实时的节点状态信息;将扫描到的节点状态信息进行与预设的告警阈值进行比较;若高于预设的告警阈值则产生告警;当产生告警时,对告警信息进行处理,判断出可恢复的告警;将可恢复告警进行恢复;对告警的恢复状态进行判断;若可恢复告警在一个扫描周期内没有恢复,则将告警权数增加,当告警权数达到设定阈值时,产生紧急告警。为了高效的管理当前数据中心节点,引入了大数据告警分析模块,从而可以更有效的管理当前节点。
技术领域
本发明涉及服务器管理技术领域,具体涉及一种基于告警分析的服务器管理方法、装置。
背景技术
对于拥有多台机柜的企业,如何管理多台机柜中的节点成为了问题,当机柜结构发生变化,如何高效的实现节点自动化位置管理成为了关键。目前对大多数企业来说,都只得人工去填写节点在机柜的位置,这不仅需要很高的成本,而且不方便管理和维护。以及当节点产生告警或者出现宕机时,如何快速的利用定位系统及时定位。那么如何实现企业级的管理成为了关键,则需要关注以下问题:a.新型机柜的生产b新型机柜和节点的交互c数据结构构建d数据展示e节点管理f告警与定位相结合的问题。
发明内容
针对目前对大多数企业来说,都只得人工去填写节点在机柜的位置,这不仅需要很高的成本,而且不方便管理和维护,以及当节点产生告警或者出现宕机时,不能快速的时定位的问题,本发明提供一种基于告警分析的服务器管理方法、装置。
本发明的技术方案是:
一方面,本发明技术方案提供一种基于告警分析的服务器管理方法,包括如下步骤:
扫描整个数据中心的节点,获取实时的节点状态信息;
将扫描到的节点状态信息进行与预设的告警阈值进行比较;若高于预设的告警阈值则产生告警;
当产生告警时,对告警信息进行处理,判断出可恢复的告警;
将可恢复告警进行恢复;
对告警的恢复状态进行判断;若可恢复告警在一个扫描周期内没有恢复,则将告警权数增加,当告警权数达到设定阈值时,产生紧急告警。
优选地,若高于预设的告警阈值则产生告警的步骤包括:
若节点状态信息与预设的告警阈值的差值小于第一阈值,产生轻微告警;
若节点状态信息与预设的告警阈值的差值大于第二阈值,产生严重告警;
第二阈值与第一阈值的差大于预设的权限阈值。
优选地,扫描整个数据中心的节点,获取实时的节点状态信息的步骤包括:
使用SNMP协议扫描整个数据中心的节点,获取实时的节点状态信息。
优选地,使用SNMP协议扫描整个数据中心的节点,获取实时的节点状态信息的步骤包括:
使用SNMP协议定时扫描整个数据中心的节点;
若扫描到的节点是网络设备,则通过SNMP协议获取当前设备的运行信息;
若扫描到的节点是是终端设备,则通过RedFish协议,获取服务器的运行信息。
优选地,网络设备的运行信息包括内存利用率、CPU温度、CPU使用率、磁盘利用率;
服务器的运行信息包括磁盘利用率、CPU温度、CPU使用率、电源、网络、内存。
优选地,扫描整个数据中心的节点,获取实时的节点状态信息的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011148684.1/2.html,转载请声明来源钻瓜专利网。