[发明专利]基于序列模式的DRAM故障关联分析方法在审
申请号: | 201910832284.3 | 申请日: | 2019-09-04 |
公开(公告)号: | CN112445636A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 刘睿涛;宋长明;刘沙;钱宇;李伟东;张宏宇;龚道永;吴文斌 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F16/215;G06F16/22;G06F16/2458 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214083 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 序列 模式 dram 故障 关联 分析 方法 | ||
本发明公开一种基于序列模式的DRAM故障关联分析方法,包括以下步骤:对故障数据库中的非DRAM故障进行过滤,获得所需的DRAM故障数据;获得DRAM故障序列数据库;建立序列DRAM故障序列数据库;采用GSP算法,设定支持度,扫描序列DRAM故障序列数据库,获取所有满足支持度要求的DRAM故障序列的支持度;筛选出DRAM严重故障与DRAM严重故障、DRAM非严重故障与DRAM严重故障的序列规则,并计算其置信度;筛选出置信度大于60%的序列规则;如果出现反映DRAM严重故障与DRAM严重故障的序列规则,则表明DRAM严重故障与DRAM严重故障存在关联性;如果未出现反映DRAM非严重故障与DRAM严重故障关联的序列规则,则表明DRAM非严重故障不会导致DRAM严重故障。本发明解决了故障分析与预测关心的预测预警问题,具备高可信性和通用性,优化了分析执行效率。
技术领域
本发明涉及一种基于序列模式的DRAM故障关联分析方法,属于计算机技术领域。
背景技术
在超级计算机中,DRAM(内存)单错与DRAM多错之间,常常被认为具有因果关系,即某CPU节点的DRAM单错的多次发生,会导致该CPU节点的DRAM多错的发生。在神威系列超级计算机中,设计了DRAM单错对DRAM多错的预警机制。该机制增加了CPU设计复杂性,带来了芯片面积、功耗及容错等方面的开销。此外,DRAM多错对后续DRAM多错的影响也需要进行分析。因此,如何获取DRAM单错与DRAM多错、DRAM多错与DRAM多错之间的联系,解决故障分析与预测关心的预测预警问题,成为本领域技术人员努力的方向。
发明内容
本发明的目的是提供一种基于序列模式的DRAM故障关联分析方法,该基于序列模式的DRAM故障关联分析方法解决了故障分析与预测关心的预测预警问题,具备高可信性,优化了分析执行效率,还具备通用性。
为达到上述目的,本发明采用的技术方案是:一种基于序列模式的DRAM故障关联分析方法,包括以下步骤:
S11、对故障数据库中的非DRAM故障进行过滤,同时对同一时刻同一位置的相同故障进行排重,获得所需的DRAM故障数据;
S12、对S11中获得的DRAM故障数据,依次以CPU序号和故障发生时间进行排序,获得DRAM故障序列数据库;
S13、将所有的DRAM单错相关的故障类型映射并替换为DRAM_SBE(DRAM单错),将所有的DRAM多错或DRAM严重故障相关的故障类型映射并替换为DRAM_MBE(DRAM多错),并据此将S12中获得的DRAM故障序列数据库规约为只有2种故障类型(DRAM_SBE和DRAM_MBE)的故障序列数据集,建立新的DRAM故障序列数据库;
S2、采用GSP(General Sequential Patterns)算法设定支持度,扫描新的DRAM故障序列数据库,获取所有满足支持度要求的DRAM故障序列的支持度;
S3、从S2中生成的DRAM故障序列中,筛选出DRAM单错导致DRAM多错、DRAM多错导致DRAM多错的序列规则,并计算其置信度;
S4、从S3中生成的序列规则中,筛选出置信度大于置信度阈值的序列规则;
S41、如果置信度大于置信度阈值的序列规则中出现反映DRAM多错导致DRAM多错的序列规则,则表明DRAM多错与DRAM多错存在关联性,反之则表明DRAM多错与DRAM多错不存在关联性;
S42、如果置信度大于置信度阈值的序列规则中未出现反映DRAM单错与DRAM多错关联的序列规则,则表明DRAM单错不会导致DRAM多错,反之则表明DRAM单错会导致DRAM多错。
上述技术方案中进一步改进的方案如下:
1. 上述方案中,在S12中,获得DRAM故障序列数据库包含以下信息:CPU序号、故障发生时间、故障事件。
2. 上述方案中,所述置信度阈值为60%或大于60%。
由于上述技术方案的运用,本发明与现有技术相比具有下列优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910832284.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抬杆控制方法、装置、监控设备及监控系统
- 下一篇:气流引导装置和其应用