[发明专利]内存故障信息记录方法及设备在审
申请号: | 202110957356.4 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113742123A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 陈力皓 | 申请(专利权)人: | 新华三技术有限公司合肥分公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230001 安徽省合肥市高新区创*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内存 故障 信息 记录 方法 设备 | ||
本公开提供一种内存故障信息记录方法及设备,用于解决内存故障定位和维护困难的技术问题。本公开技术方案在CPU内部故障寄存器中记录内存故障信息,CPU通过中断通知BIOS出现内存故障,BIOS根据内存配置和从CPU获取的内存故障信息计算出产生故障的内存物理地址,由单板管理控制器BMC/HDM将内存故障详细信息写入到故障内存的序列存在检测SPD空间内。本公开能够实现不依赖存储日志,更加准确地定位内存故障准确,能够提高维护效率,降低维护成本。
技术领域
本公开涉及计算机技术领域,尤其涉及一种内存故障信息记录方法及设备。
背景技术
内存器件随着时间推移,某些含有物理缺陷的单元可能会逐渐恶化,产生错误。服务器在客户现场使用过程中,内存上电自检后,CPU对内存的数据访问读写,由于内存故障可能导致服务器禁用内存,出现挂死宕机的情况,影响客户的开机第一体验和严重影响客户系统。而内存的故障是不可以避免的,如何提升服务器的可靠性、可用性和可服务性则是服务器开发商之间竞争的焦点,内存的RAS更是客户所关注的,如何拦截故障,准确上报故障,准确记录故障信息,稳定复现故障,最终改进内存工艺是达成目标的关键路径。
目前,服务器故障收集都采取基板管理控制器(Baseboard ManagementController,BMC)日志来记录各个故障寄存器的值,这种方式无法精确到具体内存颗粒的具体位置。这些故障信息对一线维护和内存厂商更换和提升工艺又十分重要,客户申报维修,每次都要去下载繁琐的日志。某些情况下,一线维修人员可能无法拿到想要的具体日志,拿不到BMC日志,维护人员就无法确定是否有故障生成,具体是哪根内存出现故障,即便拿到日志,分析内存故障也需要时间,影响客户体验,效率低下,阻碍客户与服务器厂商的长期合作发展。
发明内容
有鉴于此,本公开提供一种内存故障信息记录方法及设备,用于解决内存故障定位和维护困难的技术问题。
基于本公开实施例的一方面,本公开提供了一种存故障信息记录方法,包括:
CPU在启动阶段对内存进行读写检测或在启动后对内存数据进行读写时,检测到内存故障时,将内存故障信息记录到CPU的故障寄存器中并主动触发内存故障中断;
BIOS接收到中断后,从CPU内的故障寄存器中读取内存故障信息,由BIOS内的中断处理程序根据服务器内存配置及内存故障信息计算产生故障的内存的内存物理地址;
BIOS将详细内存故障信息上报给单板管理控制器;所述详细内存故障信息包括至少包括从CPU获得的内存故障信息、产生故障的内存的内存物理地址和出现故障的环境信息;
将详细内存故障信息存储到产生故障的内存的序列存在检测SPD空间内。
基于本公开一实施例,进一步地,所述将详细内存故障信息存储到产生故障的内存的序列存在检测SPD空间内的步骤具体为:
单板管理控制器将BIOS上报的详细内存故障信息存储到产生故障的内存的序列存在检测SPD空间内。
基于本公开一实施例,进一步地,所述将详细内存故障信息存储到产生故障的内存的序列存在检测SPD空间内的步骤具体为:
在BIOS将详细内存故障信息上报给单板管理控制器之前,由BIOS将详细内存故障信息存储到产生故障的内存的序列存在检测SPD空间内。
进一步地,所述故障寄存器是MSR寄存器或CSR寄存器。
进一步地,在所述将详细内存故障信息存储到产生故障的内存的序列存在检测SPD空间内之前,还包括:
对所述详细内存故障信息进行格式转化并进行加密。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三技术有限公司合肥分公司,未经新华三技术有限公司合肥分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110957356.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种樱花树种植树苗花期延长营养液缓流补充设备
- 下一篇:一种板材切割设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置