[发明专利]服务器故障可视化侦测及处理方法、系统及可编程芯片在审
申请号: | 201410258508.1 | 申请日: | 2014-06-11 |
公开(公告)号: | CN104021054A | 公开(公告)日: | 2014-09-03 |
发明(设计)人: | 郑天 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王丹;栗若木 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 故障 可视化 侦测 处理 方法 系统 可编程 芯片 | ||
技术领域
本发明涉及计算机应用技术领域,具体涉及一种服务器故障可视化侦测及处理方法、系统及可编程芯片。
背景技术
高可靠性作为服务器的一个重要特性,使得故障检测必然成为服务器的一个重要功能。目前服务器故障检测主要是利用的LED灯与故障手册结合的方式,具体就是用户先判断LED灯的状态,然后查阅故障手册定位具体的故障,这种方法的缺点是故障手册中信息一般都很多,用户查找会花费很多的时间,无法做到快速定位故障的目的。
其次,传统的故障检测方法是通过BMC直接控制LED驱动器,如图1所示,基板管理控制器(Baseboard Management Controller,简称BMC)通过SMB(SMBUS的缩写)直接控制LED驱动器,让LED矩阵可以随时显示服务器的运行情况。当前,为了更好的实现人机交互,故障检测需要显示的内容的丰富性和即时性要求也越来越高。但是这样会占用运算能力有限的BMC相当多的资源,甚至有可能出现显示不及时的状况。并且,传统的故障检测方法仅适用于单节点非冗余系统,即每个节点的BMC智能控制相对于的LED矩阵,这种架构不适用于多节点系统和冗余系统。
发明内容
本发明需要解决的技术问题是提供一种服务器故障可视化侦测及处理方法、系统及可编程芯片,不仅能够减少BMS的占用率,还可以达到快速定位故障的目的。
为了解决上述技术问题,本发明提供了一种服务器故障可视化侦测及处理方法,包括:
可编程芯片接收服务器中的基板管理控制器BMC发送的故障信息;
所述可编程芯片将所述故障信息发送至OLED显示器进行显示,并且根据所述故障信息判断故障级别,根据所述故障级别反馈相应的处理策略至所述BMC,以驱动所述BMC根据所述处理策略对所述服务器进行相应处理。
进一步地,还包括:
所述可编程芯片接收到所述BMC发送的服务器的工作状态信息;
所述可编程芯片将所述工作状态信息发送至OLED显示器进行显示。
进一步地,所述可编程芯片采用智能平台管理接口IPMI协议与所述BMC进行通信;所述可编程芯片通过I2C总线接收所述BMC发送的所述故障信息,通过通用异步收发器UART接口接收所述BMC发送的所述工作状态信息;所述可编程芯片通过UART接口反馈所述相应的处理策略至所述BMC;
其中,所述可编程芯片为片上可编程系统PSOC系列芯片。
进一步地,所述故障信息包括:定位信息和报错信息;
所述方法还包括:BMC通过与FPGA通信进行定位,将所述故障信息以数据包格式发送给所述可编程芯片;所述定位信息为发生故障的硬件信息,所述报错信息为所述发生故障的硬件的出错信息。
进一步地,所述方法还包括:为每个故障级别设置相应的阈值以及处理策略,
所述根据所述故障信息判断故障级别,根据所述故障级别反馈相应的处理策略至所述BMC,以驱动BMC根据所述处理策略对服务器进行相应处理,包括:
如果所述报错信息达到某一故障级别对应的阈值,则判断发生的故障为该故障级别,并查询对应的处理策略,将所述处理策略发送至所述BMC,其中,所述处理策略中还包括:所述定位信息和所述故障级别。
进一步地,所述BMC包括一个或多个。
为了解决上述技术问题,本发明还提供了一种可编程芯片,用于服务器故障可视化侦测及处理,包括:
接收模块,用于接收BMC发送的故障信息;
显示控制模块,用于将所述故障信息发送至OLED显示器进行显示;
故障控制模块,用于根据所述故障信息判断故障级别,根据所述故障级别反馈相应的处理策略至所述BMC,以驱动BMC根据所述处理策略对服务器进行相应处理。
进一步地,所述可编程芯片采用IPMI协议与所述BMC进行通信;
所述接收模块,还用于通过I2C总线接收所述故障信息;
所述显示控制模块,还用于通过串行外设接口SPI将所述故障信息发送至所述OLED显示器;
所述故障控制模块,还用于通过UART接口反馈所述相应的处理策略至所述BMC。
进一步地,所述故障信息包括:定位信息和报错信息;所述定位信息为发生故障的硬件的位置信息,所述报错信息为所述发送故障的硬件的出错信息。
所述故障控制模块,还用于为每个故障级别设置相应的阈值以及处理策略;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410258508.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光致变色调光隔热膜
- 下一篇:一种快换式净水器滤瓶组件