[发明专利]一种服务器记录内存故障的方法在审
申请号: | 202210523794.4 | 申请日: | 2022-05-13 |
公开(公告)号: | CN115129497A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 陈小春;张超;朱立森;孙亮;郭馨;王亚洲 | 申请(专利权)人: | 昆仑太科(北京)技术股份有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F9/4401 |
代理公司: | 北京艾纬铂知识产权代理有限公司 16101 | 代理人: | 高会允 |
地址: | 100083 北京市海淀区卧*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 记录 内存 故障 方法 | ||
本发明属于计算机固件技术领域,具体涉及一种服务器记录内存故障的方法。本发明的方法在服务器内存不在位或内存故障发生后,通过查看日志的方式获知服务器内存故障状态,从而快速定位到服务器无法正常开机的问题,并较少占用BMC的系统资源。
技术领域
本发明属于计算机固件技术领域,具体涉及一种服务器记录内存故障的方法。
背景技术
BMC(Baseboard Management Controller)与IPMI(Intelligent PlatformManagement Interface),即基板管理控制器与智能型平台管理接口,是服务器的基本核心功能子系统,负责服务器的硬件状态管理、操作系统管理、健康状态管理、功耗管理等核心功能。
BMC是独立于服务器系统之外的小型操作系统,是一个集成在主板上的芯片,也有产品是通过PCIE等形式插在主板上,对外表现形式只是一个标准的RJ45网口,拥有独立IP的固件系统。服务器集群一般使用BMC指令或进行大规模无人值守操作,包括服务器的远程管理、监控、安装、重启等。
现有的服务器发生内存故障时,存在以下问题:
1)现有的服务器在DIMM0不在位或DIMM0故障时,BIOS无法正常运行。在内存问题解决后,BIOS不能记录此前存在过DIMM0不在位或故障的日志,即无法与BMC记录的服务器告警日志保持统一,不利于用户查看服务器运行状况。
2)BIOS从BMC获取数据记录日志存在重复记录的风险。
3)服务器内存故障后,BMC获取内存故障状态的方式繁琐。
发明内容
有鉴于此,本发明提供了一种服务器记录内存故障的方法,能够解决记录内存故障的问题。
本发明的技术解决方案是:
一种服务器记录内存故障的方法,该方法实现的步骤包括:
1.BMC
步骤一、服务器开机。可通过向BMC发送IPMI开机命令或在BMC Web页面点击开机按键远程控制服务器开机。
步骤二、定时器开始计时。在判断服务器为开机状态后,BMC系统内的定时器模块开始计时,记录已开机时间。
步骤三、判断已开机时间是否大于4分钟且小于8分钟。因为不同服务器硬件环境不同,BMC获取CPU的IIC控制权的时间会有差异,所以定义该时间段是为适用于不同服务器。当开机时间大于8分钟,则停止对开机时间计时。当开机时间小于4分钟,则继续计时。
步骤四、当开机时间满足大于等于4分钟且小于等于8分钟的条件时,BMC获取自检码(POST code)。BMC通过IIC总线从CPU寄存器(寄存器地址0x28800024)获取POST code,该寄存器默认值为0x20171018。BMC与CPU的IIC拓扑示意图如图2。
步骤五、检测POST code是否提示内存故障,如果有上报内存故障告警。POST code错误码的定义如表2。BMC对获取的POST code进行解析,在判断获取到的POST code的值为0时,BMC在系统日志记录DIMM0不在位的日志。在判断获取到的POST code值为1时,BMC在系统日志记录DIMM0故障的日志。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆仑太科(北京)技术股份有限公司,未经昆仑太科(北京)技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210523794.4/2.html,转载请声明来源钻瓜专利网。