[发明专利]一种定位故障内存的方法、系统、BMC及服务器在审
申请号: | 202210151792.7 | 申请日: | 2022-02-18 |
公开(公告)号: | CN114564344A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 巩琦 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳虹 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 定位 故障 内存 方法 系统 bmc 服务器 | ||
本申请公开了一种定位故障内存的方法、系统、BMC及服务器,该方案中,在接收到BIOS芯片发送的不小于预设数量的日志时,判断N个CPU中是否存在CPU开启内存检测功能;在存在CPU开启内存检测功能时,获取每个日志中的内存故障码,内存故障码为真正内存故障码或非真正内存故障码;若内存故障码为真正内存故障码,则对内存故障码对应的存储器进行标记。判定内存故障码为真正内存故障码时,表明该内存故障码对应的存储器出现故障,对其进行标记,进而使维修人员根据标记进行存储器的更换,避免了未出现故障的存储器的不必要更换。
技术领域
本发明涉及定位故障内存的技术领域,特别是涉及一种定位故障内存的方法、系统、BMC及服务器。
背景技术
现有技术中,服务器可能包含多个CPU,每个CPU下连接了多个通道,每个通道下又连接了多个存储器,当CPU开启内存检测功能时,若一个存储器出现故障,CPU可能检测到该存储器所属的通道的输出信号不合格,此时CPU会禁用该通道,导致该通道下的所有存储器均被禁用;CPU也可能检测到自身连接的多个通道输出的信号总体不合格,此时CPU会禁用自身连接的多个通道,导致该多个通道下的所有存储器均被禁用;上述情况导致了一个存储器出现故障而牵连多个未出现故障的存储器被禁用,现有技术的处理方法是将所有被禁用的存储器进行更换,造成了未出现故障的存储器的不必要更换。
发明内容
本申请的目的是提供一种定位故障内存的方法、系统、BMC及服务器,该方案中,判定内存故障码为真正内存故障码时,表明该内存故障码对应的存储器出现故障,对其进行标记,进而使维修人员根据标记进行存储器的更换,避免了未出现故障的存储器的不必要更换。
为解决上述技术问题,本申请提供了一种定位故障内存的方法,应用于服务器中的BMC,所述服务器还包括与所述BMC连接的BIOS芯片、与所述BIOS芯片连接的N个CPU、与每个所述CPU连接的M个通道和与每个所述通道连接的H个存储器,N、M、H为正整数;
所述定位故障内存的方法包括:
在接收到所述BIOS芯片发送的不小于预设数量的日志时,判断N个所述CPU中是否存在CPU开启内存检测功能;
在存在CPU开启内存检测功能时,获取每个所述日志中的内存故障码,所述内存故障码为真正内存故障码或非真正内存故障码;
若所述内存故障码为真正内存故障码,则对所述内存故障码对应的存储器进行标记。
优选的,还包括:
在不存在CPU开启内存检测功能时,对每个所述日志对应的存储器进行标记。
优选的,判断N个所述CPU中是否存在CPU开启内存检测功能,包括:
在检测到存储区域内存储的信息中包含所述BIOS芯片控制所述CPU开启内存检测功能的信息时,判定N个所述CPU中存在CPU开启内存检测功能;
在检测到存储区域内存储的信息中不包含所述BIOS芯片控制所述CPU开启内存检测功能的信息时,判定N个所述CPU中不存在CPU开启内存检测功能。
优选的,所述非真正内存故障码包括MajorCode=0x0a,MinorCode=0x04;MajorCode=0x0a,MinorCode=0x03;和MajorCode=0x39,MinorCode=0x05。
优选的,对所述内存故障码对应的存储器进行标记之后,还包括:
控制提示模块对被标记的存储器进行提示。
优选的,所述提示模块为显示模块。
优选的,还包括:
若所述内存故障码为非真正内存故障码,则控制提示模块对所述内存故障码对应的存储器进行提示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210151792.7/2.html,转载请声明来源钻瓜专利网。