[发明专利]一种服务器PCIe设备故障记录的系统及方法在审
申请号: | 201811434099.0 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109542752A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 孙一心 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 王汝银 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障记录 黑盒 故障位置信息 寄存器 服务器 配置空间寄存器 寄存器读取 日志保留 信息漏失 触发 日志 分析 中断 监控 检测 记录 | ||
1.一种服务器PCIe设备故障记录的系统,其特征在于,包括:
CPU单元:用于存储PCIe设备配置空间寄存器;
BIOS单元:用于当BIOS单元监控到PCIe设备发生UCE故障时,收集故障PCIe设备的寄存器的值和故障信息;所述寄存器的值和故障信息位于CPU单元空间寄存器中的AERcapability中;
BMC单元:用于通过impi命令接收从BIOS单元发送的寄存器的值和故障位置信息;同时将寄存器的值和故障位置信息记录到黑盒日志中;
黑盒日志:用于记录寄存器的值和故障位置信息,并根据所述寄存器的值对寄存器进行解析;
所述BIOS单元通过PECI链路与CPU单元数据通信;所述BMC单元通过KCS链路与BIOS单元数据通信。
2.根据权利要求1所述的一种服务器PCIe设备故障记录的系统,其特征在于,所述故障PCIe设备的寄存器包括uncorrectable error status register、correctable errorstatus register和header log register。
3.根据权利要求1所述的一种服务器PCIe设备故障记录的系统,其特征在于,所述故障信息的类型包括uncorrectable fatal error、correctable non-fatal error和correctable error。
4.根据权利要求1所述的一种服务器PCIe设备故障记录的系统,其特征在于,所述BIOS单元包括监测单元和收集单元;
所述监测单元用于检测PCIe设备是否发生UCE故障;
所述收集单元用于收集故障PCIe设备的寄存器的值和故障信息。
5.根据权利要求1所述的一种服务器PCIe设备故障记录的系统,其特征在于,所述BMC单元包括接收模块和写入模块;
所述接收模块用于通过impi命令接收从BIOS单元发送的寄存器的值和故障位置信息;所述写入模块用于将寄存器的值和故障位置信息记录到黑盒日志中。
6.一种服务器PCIe设备故障记录的方法,是基于权利要求1至5任意一项所述的一种服务器PCIe设备故障记录的系统实现的,其特征在于,包括以下步骤:
S1:当BIOS单元监控到PCIe设备发生UCE故障时,将PCIe设备配置空间寄存器中的AERcapability寄存器收集出来,并将所述AER capability寄存器的值以及故障位置信息通过impi命令发送给BMC;
S2:BMC单元接收所述AER capability寄存器的值以及故障位置信息,并将所述AERcapability寄存器的值以及故障位置信息记录到黑盒日志中。
7.根据权利要求6所述的一种服务器PCIe设备故障记录的方法,其特征在于,在执行步骤S1之前,还包括当PCIe设备发生UCE故障时,会触发UCE中断,BIOS单元判断故障的位置。
8.根据权利要求7所述的一种服务器PCIe设备故障记录的方法,其特征在于,所述BIOS单元判断故障的位置的方法为当PCIe链路上出现UCE错误,系统通过NMI中断的方式发送Error Message给Root,通知Root发生了System Error;所述NMI中断中包括PCIE故障的位置信息,所述BIOS接收到所述NMI中断后,通过NMI中断向量得出故障位置信息。
9.根据权利要求6所述的一种服务器PCIe设备故障记录的方法,其特征在于,在步骤S1中,所述当BIOS单元监控到PCIe设备发生UCE故障时,将PCIe设备配置空间寄存器中的AERcapability寄存器收集出来的方法为,在intel的EDS文档中指明了所述PCIe设备配置空间寄存器的地址,BIOS通过访问所述PCIe设备配置空间寄存器的地址读取在CPU单元的PCIe设备配置空间寄存器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811434099.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分布式日志系统
- 下一篇:软件集成测试方法及平台