[发明专利]内存ECC报错阈值的确定方法、确定装置及确定设备有效
申请号: | 201911037924.8 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110781027B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 庞潇 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/10 | 分类号: | G06F11/10 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 史翠 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内存 ecc 阈值 确定 方法 装置 设备 | ||
本发明公开了一种内存ECC报错阈值的确定方法,区分运行状态信息为正常运行信息或故障信息,通过获取各内存条的ECC报错数量和运行状态信息,生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值,最后输出内存条的ECC报错阈值,以ECC报错数量和运行状态信息的分布情况为依据,形成一种自动生成ECC报错阈值的方案,无需技术人员根据经验设置ECC报错阈值,能够方便快捷的得到ECC报错阈值,具有较高的实用性。本发明还公开了一种内存ECC报错阈值的确定装置、确定设备及计算机可读存储介质,具有上述有益效果。
技术领域
本发明涉及服务器技术领域,特别是涉及一种内存ECC报错阈值的确定方法、确定装置、确定设备及计算机可读存储介质。
背景技术
ECC(Error Correcting Code,错误检查和纠正)是一种能够实现“错误检查和纠正”的技术,ECC内存就是应用了这种技术的内存,一般多应用在服务器及图形工作站上,这将使整个电脑系统在工作时更趋于安全稳定。在服务器上,通过设置内存ECC报错阈值来管控内存条的更换,当内存条的ECC报错数量达到ECC报错阈值时,服务器发出告警提示用户进行内存条的更换,保障产品性能和稳定性。
内存保存数据的原理是由内存颗粒中每个cell电容保持的电荷水平高低来表征0/1数据,当读取的数据与写入内存cell的数据不一致时,就会发生ECC错误。内存ECC错误分为两种:一是硬错误,由内存条本身故障导致比如cell电荷保持能力低、物理损伤等,较易复现;二是软错误,由一些干扰,比如主板SI影响、噪声、高温、像电、磁场甚至宇宙射线的干扰导致,比较随机不容易复现。针对内存条本身的故障,需要更换内存条;但是针对随机偶发的软错误则不必过度反应导致内存频繁更换。
因此,设置合适的ECC报错阈值非常重要,阈值过低导致频繁更换内存条,阈值过高又导致ECC错误影响产品质量。现有技术中设置ECC报错阈值需要借助有经验的技术人员进行大量的实验来实现,这不利于产品的高效生产。
提供一种方便实用的ECC报错阈值的确定方法,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种内存ECC报错阈值的确定方法、确定装置、确定设备及计算机可读存储介质,相较于现有技术降低了对人工经验的依赖,能够方便快捷的得到合适的ECC报错阈值,具有较高的实用性。
为解决上述技术问题,本发明提供一种内存ECC报错阈值的确定方法,包括:
获取各内存条的ECC报错数量和运行状态信息;
生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值;
输出所述内存条的ECC报错阈值;
其中,所述运行状态信息为正常运行信息或故障信息。
可选的,所述获取各内存条的ECC报错数量,具体包括:
接收预定时间段内各所述内存条的ECC报错信息;
根据各所述ECC报错信息统计得到各所述内存条的ECC报错数量。
可选的,所述获取各内存条的运行状态信息,具体包括:
接收输入的对所述内存条的检测信息;
根据所述检测信息确定所述内存条的运行状态信息。
可选的,所述根据所述检测信息确定所述内存条的运行状态信息,具体包括:
判断所述检测信息是否为ECC硬错误信息;
如果否,则将所述内存条的运行状态信息置为正常运行信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911037924.8/2.html,转载请声明来源钻瓜专利网。