[发明专利]一种监控BMC的方法、设备以及存储介质在审
申请号: | 201911241251.8 | 申请日: | 2019-12-06 |
公开(公告)号: | CN111158975A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 车升娜 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/14;G06F8/61 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 陈黎明 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监控 bmc 方法 设备 以及 存储 介质 | ||
本发明公开了一种监控BMC的方法,包括基于CPU执行以下步骤:向BMC发送验证指令;根据是否接收到所述BMC的回执判断所述BMC的状态;响应于没有接收到所述回执,返回向所述BMC发送所述验证指令;响应于继续发送所述验证指令的次数达第一预设次数后仍没有接收到所述回执,控制所述BMC重启;响应于所述BMC重启成功,返回向BMC发送验证指令的步骤。本发明还公开了一种计算机设备以及可读存储介质。本发明公开的方案在已有BMC监控CPU的基础上,实现了CPU对BMC的监控,即两者的互相监控。当BMC出现一些异常时无需研发和运维人员的处理就可以使BMC恢复正常监控状态。
技术领域
本发明涉及服务器领域,具体涉及一种监控BMC的方法、设备以及存储介质。
背景技术
BMC是独立于CPU端NOS(Network Operating System,网络操作系统)外的一个独立系统。BMC拥有自己独立的处理器和内存,可独立运行于NOS之外。在NOS宕机或硬件故障后,BMC依然可以运行并对NOS进行管理或者硬件资源诊断。
目前BMC基本都是单芯片,若BMC系统在使用过程出现异常,则不仅会影响对NOS的监控,而且会产生一些异常的报错,这样就完全背离了当初使用它的初衷。例如,当CPU正常,但是BMC某些进程或整个程序挂掉时,如:风扇监测进程挂掉,CPU达到高温时就,就无法自动启动散热策略,而引起机器过温,烧坏机器。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例的提出一种监控BMC的方法,包括步骤:
向BMC发送验证指令;
根据是否接收到所述BMC的回执判断所述BMC的状态;
响应于没有接收到所述回执,返回向所述BMC发送所述验证指令;
响应于继续发送所述验证指令的次数达第一预设次数后仍没有接收到所述回执,控制所述BMC重启;
响应于所述BMC重启成功,返回向BMC发送验证指令的步骤。
在一些实施例中,还包括:
响应于接收到所述回执,监控所述BMC的若干个进程的状态;
响应于所述若干个进程中存在状态异常的进程,重启所述状态异常的进程;
响应于所述若干个进程的状态均正常或重启所述状态异常的进程成功,获取所述BMC下的监控信息,并返回向BMC发送验证指令的步骤。
在一些实施例中,还包括:
响应于重启所述状态异常的进程失败,控制所述BMC重启;
响应于所述BMC重启成功,返回向BMC发送验证指令的步骤。
在一些实施例中,还包括:
响应于所述BMC重启失败,再次重启所述BMC;
响应于继续重启所述BMC的次数达第二预设次数后所述BMC仍重启失败,获取BMC镜像;
利用所述BMC镜像对所述BMC进行重装。
在一些实施例中,还包括:
响应于所述BMC重装成功,将所述监控信息传输到重装后的BMC,并返回向BMC发送验证指令的步骤;
响应于所述BMC重装失败,记录所述BMC异常信息。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:
至少一个处理器;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911241251.8/2.html,转载请声明来源钻瓜专利网。