[发明专利]PCIE设备故障处理方法和装置有效
申请号: | 202210267836.2 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114356644B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 薛荀 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 郝玉娥 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | pcie 设备 故障 处理 方法 装置 | ||
本申请公开了PCIE设备故障处理方法和装置。其中所述方法包括:在BIOS初始化时获取PCIE插槽上的PCIE设备类型信息;根据PCIE设备类型信息,将PCIE插槽对应的IIO端口的DPC功能设置为开启或者关闭;通过DPC处理PCIE设备故障,在PCIE故障出现时,通过BIOS和操作系统的共同作用,使得PCIE链路迅速地断开再重连,由此完成故障的快速恢复,降低PCIE故障导致的宕机,在PCIE故障时仍能保持服务器的正常使用,增强服务器的稳定性。采用这种处理方式,使得有针对性的设置不同PCIE设备对应的IIO端口的DPC功能,避免出现因采用统一设置选项导致的部分PCIE设备断开后无法重连的情况,可以满足不同PCIE设备的故障处理需求。
技术领域
本申请涉及服务器技术领域,具体涉及PCIE设备故障处理方法和装置,基本输入输出系统,以及主板管理控制器。
背景技术
随着云计算的普遍推广和应用,需要建立越来越多的数据中心,服务器作为数据中心中重要的基础设施,其稳定性直接影响着云服务的体验和价值。PCIE(高速串行计算机扩展总线标准)设备是服务器的重要组件,每台服务器上均有配置,当PCIE设备出现不可纠正故障时,会直接影响到服务器的操作系统OS,导致服务器出现宕机。
目前,服务器主要采用标准的PCIE高级错误报告(Advanced Error Reporting,AER)机制来处理PCIE故障。在该机制下可以有两种实施方式:降低PCIE故障的错误等级,屏蔽PCIE故障的中断上报。其中,降低PCIE故障的错误等级的方式为:通过设置PCIE的Uncorrectable Error Severity Register的值,将PCIE故障的错误等级定义为可纠正的故障,这样在产生SMI中断中到BIOS后,PCIE AER error handler按照可纠正故障处理并上报OS,OS感知到此为可纠正的故障,可以在一定程度上,保持系统的可用性。屏蔽PCIE故障的中断上报的方式为:通过设置PCIE的Uncorrectable Error Mask Register的值,屏蔽指定的PCIE故障,当此故障出现时,不会触发SMI中断,BIOS不处理,OS也感知不到此故障,可以在一定程度上,保持系统的可用性。
然而,在实现本发明过程中,发明人发现上述技术方案至少存在如下问题:1)上述降低PCIE故障的错误等级的方式是通过降低故障等级达到一定的稳定性提升,但是故障时的数据或者事务依然会扩散到系统中的使用者,存在很大的风险,最终仍然会导致系统的紊乱异常;2)上述屏蔽PCIE故障的中断上报的方式是将PCIE故障屏蔽,不触发SMI中断,做到“掩耳盗铃”,但是故障数据在进一步使用时,仍然会导致系统紊乱异常;或者PCIE故障出现surprise down error时,虽然可以不让系统宕机,但是PCIE设备会断开连接,使得PCIE设备丢失。可见,上述两种技术方案均无法中断PCIE故障信息的传播,使得故障信息继续使用,最终仍然会给系统带来风险甚至宕机。
发明内容
本申请提供PCIE设备故障处理方法,以解决现有技术存在的无法中断PCIE故障信息传播的问题。本申请另外提供PCIE设备故障处理装置,基本输入输出系统,以及主板管理控制器。
本申请提供一种PCIE设备故障处理方法,包括:
基本输入输出系统BIOS获取PCIE插槽使用情况信息,所述PCIE插槽使用情况信息包括PCIE设备类型;
根据所述PCIE设备类型,设置所述PCIE插槽对应的集成输入输出模组IIO端口的下行端口抑制DPC功能的开启或者关闭;
通过DPC处理PCIE设备故障,以使得将发生故障的PCIE设备断链,再将PCIE设备重新建链。
可选的,所述根据所述PCIE设备类型,设置所述PCIE插槽对应的集成输入输出模组IIO端口的下行端口抑制DPC功能的开启或者关闭,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210267836.2/2.html,转载请声明来源钻瓜专利网。