[发明专利]一种交互型服务器智能故障处理系统、方法在审
申请号: | 202011171776.1 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112486743A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 赵子腾 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/26 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 李舜江 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交互 服务器 智能 故障 处理 系统 方法 | ||
本发明提供一种交互型服务器智能故障处理系统、方法,所述系统包括智能故障处理板卡和主板;智能故障处理板卡通过金手指与主板进行通信连接;主板上设置有BMC,BMC包括ADC监控模块,用于监控主板的上电状态并将监控状态传递给智能故障处理板卡;主板上电后进行功能测试,并将测试过程出现的告警信息传递给智能故障处理板卡;智能故障处理板卡,用于将接收到的上电状态信息进行分析处理,进行故障定位并发送指令到主板进行BMC日志的收集。该系统能够帮助测试人员将各个bug所属领域进行分类,解决bug定位不准确造成的人力浪费,效率低下的问题。
技术领域
本发明涉及服务器智能管理技术领域,具体涉及一种交互型服务器智能故障处理系统、方法。
背景技术
随着服务器行业及相关技术的不断发展,其功能不断丰富,设计越来越复杂,集成度越来越高,这在增加设计难度的同时也增加了服务器出现故障的可能性,因此在研发测试阶段,研发人员debug的任务越来越重,需要大量的人力来处理故障问题并对设计进行优化,与此相对应的,服务器研发人员的分工越来越细,包括硬件、软件、部件、散热、电源等,针对某一个bug可能需要多个岗位的工程师进行分析才能确定故障来源是哪一部分,在这个过程中浪费了很多不必要的人力。
目前在研发测试阶段我们进行服务器故障诊断主要有以下三种途径:(1)当BMCweb上出现告警时,如果明确是硬件方面的故障,比如上电异常,链路异常等可以针对这些报错采取相应的接触式测量,获取信号质量及状态信息,以具体排查硬件方面的错误。(2)当BMC web上出现告警且指向CPU、内存等部件时,首先保留故障现象抓取相关故障日志进行分析,然后可以再进行交叉验证排除固件单体问题。(3)开机过程中出现宕机等故障,首先抓取故障日志,然后排查是否是软件故障,需要简单的通过刷新BIOS、BMC等的固件版本来验证问题是否复现。上述操作均需测试人员保留故障现场,研发人员针对异常现象进行初步分析后再利用该系统进行故障处理。
存在的缺点如下:1.故障诊断的操作首先需要保留故障现象,而现在由于测试人员测试日程安排等原因可能无法原样保留,且有些现象为低概率事件,一旦破坏现象会给后续debug造成极大困难,很可能出现没有故障相关数据且无法复现的情况。2.有些故障分析的操作较为简单,但需要花费很长时间,比如抓取故障日志,刷新固件版本等等,这些操作都属于在复现故障现象后首先需要做的前期分析工作,得到这些前期数据后才可以进行进一步的分析。3.在抓取故障日志时还涉及抓取方式,如果使用XDP进行抓取则需要打开机箱插入XDP连接器,这在很多机箱结构中因为连接器上方往往有网卡等部件,空间较小,不容易插入连接器,如果拆下这些部件又会破坏本来的现象;如果使用DCI功能,则需要提前在BIOS中打开DCI功能,而发生宕机时不能保证该功能是打开的。4.在硬件信号测试时,当信号质量不理想时,如果信号是有CPLD发出的,首先会考虑CPLD的相关GPIO接口的驱动能力是否过高或过低,如果信号质量仍然不好,就需要更改串阻大小。但更新驱动能力需要CPLD工程师更改CPLD代码,一个信号的debug可能需要尝试多种驱动能力,每次尝试都需要发布新的CPLD版本,这就造成了debug效率较低。
发明内容
针对上述存在的故障处理过程造成了debug效率较低的问题,本发明提供一种交互型服务器智能故障处理系统、方法。
本发明的技术方案是:
第一方面,本发明技术方案提供一种交互型服务器智能故障处理系统,包括智能故障处理板卡和主板;智能故障处理板卡通过金手指与主板进行通信连接;
主板上设置有BMC,BMC包括ADC监控模块,用于监控主板的上电状态并将监控状态传递给智能故障处理板卡;主板上电后进行功能测试,并将测试过程出现的告警信息传递给智能故障处理板卡;
智能故障处理板卡,用于将接收到的上电状态信息进行分析处理,进行故障定位并发送指令到主板进行BMC日志的收集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011171776.1/2.html,转载请声明来源钻瓜专利网。