[发明专利]一种故障定位方法及服务器有效
申请号: | 201510979591.6 | 申请日: | 2015-12-23 |
公开(公告)号: | CN105589776B | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 宋刚 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 定位 方法 服务器 | ||
1.一种故障定位方法,其特征在于,包括:
获取错误数据,并在所述错误数据中确定与挂死类故障对应的超时类错误;所述错误数据用于记录服务器发生故障时产生的错误,所述超时类错误为所述服务器发生所述挂死类故障时产生的错误;
在所述超时类错误的地址寄存器中读取错误地址;
将所述错误地址与预存储的总线和接口标准PCIe设备地址空间表中的PCIe设备的地址空间进行匹配;所述PCIe设备地址空间表中记录有每一个PCIe设备与所述每一个PCIe设备的地址空间的对应关系;
若所述PCIe设备地址空间表中存在与所述错误地址匹配的地址空间,则确定所述地址空间对应的PCIe设备为导致所述挂死类故障的故障源。
2.根据权利要求1所述的方法,其特征在于,所述在所述错误数据中确定与挂死类故障对应的超时类错误具体包括:
遍历所述错误数据中的每一个错误的类型标识;
确定类型标识为超时的错误为所述挂死类故障对应的超时类错误。
3.根据权利要求1或2所述的方法,其特征在于,所述获取错误数据之前,所述方法还包括:
接收基本输入输出系统BIOS传递的每一个PCIe设备的地址空间,并根据所述每一个PCIe设备的地址空间生成所述PCIe设备地址空间表。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当热插拔所述PCIe设备后,接收所述BIOS传递的更新后的每一个PCIe设备的地址空间;
根据所述更新后的每一个PCIe设备的地址空间,生成新的PCIe设备地址空间表;
将所述PCIe设备地址空间表更新为所述新的PCIe设备地址空间表。
5.根据权利要求1、2、4任一项所述的方法,其特征在于,在所述超时类错误的地址寄存器中读取错误地址之前,所述方法还包括:
确定所述超时类错误的地址寄存器有效。
6.根据权利要求3所述的方法,其特征在于,在所述超时类错误的地址寄存器中读取错误地址之前,所述方法还包括:
确定所述超时类错误的地址寄存器有效。
7.根据权利要求1所述的方法,其特征在于,所述将所述错误地址与预存储的PCIe设备地址空间表中的PCIe设备的地址空间进行匹配具体包括:
针对所述PCIe设备地址空间表中的每一个地址空间,判断所述错误地址是否落在所述地址空间内。
8.根据权利要求7所述的方法,其特征在于,所述若所述PCIe设备地址空间表中存在与所述错误地址匹配的地址空间,则确定所述地址空间对应的PCIe设备为导致所述挂死类故障的故障源包括:
若所述错误地址落在所述地址空间内,则确定所述地址空间与所述错误地址匹配;
查询所述PCIe设备地址空间表确定所述地址空间对应的PCIe设备;
确定所述PCIe设备为导致所述挂死类故障的故障源。
9.一种服务器,其特征在于,包括:
获取单元,用于获取错误数据,并在所述错误数据中确定与挂死类故障对应的超时类错误;所述错误数据用于记录服务器发生故障时产生的错误,所述超时类错误为所述服务器发生所述挂死类故障时产生的错误;
读取单元,用于在所述获取单元确定的所述超时类错误的地址寄存器中读取错误地址;
匹配单元,将所述错误地址与预存储的总线和接口标准PCIe设备地址空间表中的PCIe设备的地址空间进行匹配;所述PCIe设备地址空间表中记录有每一个PCIe设备与所述每一个PCIe设备的地址空间的对应关系;
故障定位单元,用于若所述PCIe设备地址空间表中存在与所述错误地址匹配的地址空间,则确定所述地址空间对应的PCIe设备为导致所述挂死类故障的故障源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510979591.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动态调整内存监控阀值的方法
- 下一篇:一种故障检测的方法和装置