[发明专利]硬件报修方法、系统、设备、硬件管理服务器与存储介质有效
申请号: | 201810068181.X | 申请日: | 2018-01-24 |
公开(公告)号: | CN108199901B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 刘冰 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 硬件 报修 方法 系统 设备 管理 服务器 存储 介质 | ||
本申请公开了一种硬件报修方法,应用于硬件管理服务器,包括:获取集群服务器的SEL日志;分析SEL日志,判断是否出现错误日志;如果是,获取与错误日志对应的故障服务器;将错误日志发送给处理服务器以使处理服务器将错误日志分配至预设处理终端。本发明中硬件管理服务器自动对集群服务器的SEL日志进行分析,当发现错误日志时将其发送给处理服务器,处理服务器将错误日志分配到预设处理终端,预设处理终端对故障服务器进行相应的措施。本发明中硬件问题能自动报修,减轻了运维人员的工作负担,与人工报修相比效率更高,集群服务器的使用效率提高,使客户成本更低。本申请还公开了一种硬件报修系统、设备、硬件服务管理器及可读存储介质。
技术领域
本发明涉及设备运维领域,特别涉及一种硬件报修方法、系统、设备、硬件管理服务器与可读存储介质。
背景技术
众所周知,服务器是整个网络系统和计算平台的核心,随着云计算和大数据技术的快速发展,国内建设的数据中心也越来越多,服务器系统的数量呈现指数级别的增长,特别是云服务器系统更是得到全球各大互联网公司的大量采购。云服务器系统主要由四大部件:处理器、内存、I/O设备(包括硬盘等存储设备)组成,另外还有其他大大小小的各种部件及元器件组成。其中任何一个部件出现错误,都有可能导致服务器系统宕机或重启,特别是前面提到的四个主要部件造成的系统宕机的可能性更高。面对如此庞大数量的服务器,如何能够高效快速的定位并恢复出现硬件问题的服务器,该问题成为了服务器运维人员面临的一大挑战。
目前主流的X86云服务器管理过程是服务器运维人员基于个人的经验自己开发一套基于BMC(Baseboard Management Controller,板载管理控制器)IPMI(IntelligentPlatform Management Controller,智能平台管理接口)协议的带外管理软件,该软件不断的巡检云服务器BMC SEL日志(System Event Log,系统事件日志),发现SEL日志中有错误日志后,产生报警通知运维人员。运维人员就会查看相应的SEL错误日志,如果日志中有明显的问题原因指向则只要替换掉对应的问题部件就好(如果问题部件是可更换的部件的话)。如果SEL问题日志中没有明确的原因指向,则运维人员就会把故障服务器上的所有BMCSEL日志以及OS内的系统日志文件打包,然后发送给服务器厂商的客服人员请求分析问题原因。这一发送过程可能要花费一天甚至数天时间,效率较低。而且类似的服务器问题的报修都是运维人员的人为参与,增加了运维人员的工作负担。
发明内容
有鉴于此,本发明的目的在于提供一种可以自动报修的硬件报修方法、系统、设备、硬件管理服务器与可读存储介质。其具体方案如下:
一种硬件报修方法,应用于硬件管理服务器,包括:
获取集群服务器的SEL日志;
分析所述SEL日志,判断是否出现错误日志;
如果是,获取所述集群服务器中与所述错误日志对应的故障服务器;
将所述错误日志发送给处理服务器,以使所述处理服务器将所述错误日志分配至预设处理终端来对所述故障服务器进行处理。
优选的,所述从中获取所述集群服务器中与所述错误日志对应的故障服务器的过程同时,还包括:
向运维终端发送所述故障服务器发生错误的警告。
优选的,所述硬件报修方法还包括:
向所述运维终端发送对所述故障服务器的处理过程。
优选的,所述将所述错误日志发送给处理服务器的过程,还包括:
将所述SEL日志中与所述故障服务器相关的关联日志均发送给所述处理服务器,以便所述处理服务器将所述关联日志分配至所述预设处理终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810068181.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于智能环境的分布式推理节点优化分配方法
- 下一篇:数据传输的处理方法及装置