[发明专利]一种隔离故障设备的方法、装置和介质在审
申请号: | 201910213394.1 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109947586A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 刘冰;班华堂 | 申请(专利权)人: | 浪潮商用机器有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 250100 山东省济南市历城区唐冶新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障设备 寄存器数据 服务器系统 存储空间 隔离故障 处理器 计算机可读存储介质 存储空间记录 设备运行状态 恢复服务器 影响服务器 可用性 触发系统 人工参与 系统服务 系统启动 硬件设备 自动隔离 寄存器 断线 重启 服务器 解析 隔离 | ||
本发明实施例公开了一种隔离故障设备的方法、装置和计算机可读存储介质,系统启动时判断预先设定的存储空间是否有寄存器数据;其中,寄存器数据为处理器在系统宕机时向存储空间记录的各寄存器中的设备运行状态数据。当存储空间有寄存器数据时,处理器可以对各寄存器数据进行解析,确定出故障设备;为了避免故障设备对服务器系统的影响,在确定出故障设备之后,需要对故障设备设置隔离标识,然后再触发系统重启,此时故障设备被自动隔离,不会影响服务器系统的正常运行,减少了服务器的业务断线时间,避免了服务器系统中某个或某些硬件设备出现问题后需要人工参与才能恢复服务器系统服务,提高了服务器系统的可用性。
技术领域
本发明涉及服务器技术领域,特别是涉及一种隔离故障设备的方法、装置和计算机可读存储介质。
背景技术
众所周知,服务器系统是整个网络系统和计算平台的核心,随着云计算和大数据技术的快速发展,国内建设的数据中心也越来越多,服务器系统的数量呈现指数级别的增长。服务器系统上的主要部件包括处理器、内存条、PCIE卡、硬盘等。如果服务器系统中某一个硬件设备出现不可修复的错误,就会导致整个服务器系统的宕机,无法再提供服务。
对于服务器系统宕机的情况,现有技术中都是服务器管理人员发现并定位故障硬件设备后进行更换操作,这期间就需要花时间去定位、系统断电再上电、部件更换等一系列动作,导致服务器系统下线的时间会比较长,使得服务器出现较长时间的业务断线。
可见,如何减少业务断线的时间,是本领域技术人员亟待解决的问题。
发明内容
本发明实施例的目的是提供一种隔离故障设备的方法、装置和计算机可读存储介质,可以减少业务断线的时间。
为解决上述技术问题,本发明实施例提供一种隔离故障设备的方法,包括:
系统启动时,判断预先设定的存储空间是否有寄存器数据;其中所述寄存器数据为处理器在系统宕机时向所述存储空间记录的各寄存器中的设备运行状态数据;
若是,则对各所述寄存器数据进行解析,确定出故障设备;
对所述故障设备设置隔离标识,并触发系统重启。
可选的,所述对各所述寄存器数据进行解析,确定出故障设备包括:
判断各寄存器数据是否存在异常;
当存在寄存器数据异常的目标寄存器时,则依据寄存器与硬件设备的对应关系,确定出与所述目标寄存器相对应的故障设备。
可选的,在对各所述寄存器数据进行解析,确定出故障设备之后还包括:
判断故障设备的个数是否大于或等于预设阈值;
若是,则进行报警提示。
可选的,在对所述故障设备设置隔离标识之后,并在触发系统重启之前还包括:
删除所述存储空间中的寄存器数据。
可选的,所述在系统宕机时向所述存储空间记录的各寄存器中的设备运行状态数据包括:
在系统宕机时,判断所述存储空间是否有原始数据;
若是,则删除所述原始数据,并在删除所述原始数据之后,向所述存储空间记录各寄存器中的设备运行状态数据;
若否,则向所述存储空间记录各寄存器中的设备运行状态数据。
本发明实施例还提供了一种隔离故障设备的装置,包括判断单元、解析单元和设置单元;
所述判断单元,用于系统启动时,判断预先设定的存储空间是否有寄存器数据;其中所述寄存器数据为处理器在系统宕机时向所述存储空间记录的各寄存器中的设备运行状态数据;若是,则触发所述解析单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮商用机器有限公司,未经浪潮商用机器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910213394.1/2.html,转载请声明来源钻瓜专利网。