[发明专利]微处理器可靠性评测方法及其系统有效
申请号: | 200910241575.1 | 申请日: | 2009-11-26 |
公开(公告)号: | CN101719087A | 公开(公告)日: | 2010-06-02 |
发明(设计)人: | 潘送军;胡瑜;李晓维 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微处理器 可靠性 评测 方法 及其 系统 | ||
技术领域
本发明属于计算机领域,尤其涉及微处理器可靠性评测方法及其系统。
背景技术
随着超深亚微米工艺在微处理器制造中的逐步应用,单个芯片上集成的 晶体管数目越来越多,微处理器的性能得到大幅度提高。同时由于集成电路 特征尺寸的减少、电源电压的降低和频率的升高,使得微处理器芯片越来越 容易受到间歇故障、软错误和永久故障的影响,芯片的失效率随之不断升高, 可靠性成为微处理器设计中一个日益严峻的问题。
间歇故障是一种硬件故障,表现为一段时间内信号频繁无规律地错误跳 变,主要是由于制造工艺的变异,芯片使用过程中的老化,以及电压温度的 波动而引起的;软错误是指电路由于受到宇宙射线中的高能粒子或芯片封装 中α粒子的辐射作用,产生的单比特位翻转,从而改变存储单元中保存的数 据或逻辑电路运算结果。永久故障反映的是电路单元产生了不可恢复的故障, 主要是由于制造缺陷,如硅片中的污染或材料的老化,引起的。间歇故障和 软错误可导致相似的跳变效应,但它们之间有如下不同:第一,从空间的角 度,一个间歇故障将在同一位置出现多次,而一个软错误则几乎不会在同一 位置连续出现。第二,从时间的角度,一个间歇故障是突然频繁发生,而一 个软错误通常表现为单比特位翻转或单事件瞬态故障;第三,如果一个受间 歇故障影响的硬件结构被替换,那么发生的间歇故障将随之消失,但软错误 将同样可能发生在该结构上。间歇故障与永久故障也存在不同,主要表现为 它们的持续时间不同。随着间歇故障持续的时间不断变长,最终也可能转化 为永久故障。
本领域中有研究认为软错误和永久故障是引起微处理器芯片失效的主要 原因,根据实际系统运行过程中收集的数据显示,间歇故障已成为影响芯片 失效的最主要因素。如果不采用容错技术提高可靠性,微处理器芯片的失效 率将随着晶体管数目的增多而成指数级增长。
为提高系统的可靠性,传统采用的技术包括三模冗余和线程级冗余。三 模冗余对同一功能单元使用三个冗余模块,三个模块提供相同的输入,最后 用一个多数表决器对三个输出结果进行表决,以确定最后的输出,如图1所 示。三模冗余允许其中的任一模块出现故障,因此能实现高可靠系统,但该 技术带来的面积和功耗开销将达到300%;线程级冗余技术中通过对运行的线 程产生一个冗余线程,其中一个称为主线程,另外一个称为从线程,两个线 程的输入一致,产生的结果需比较一致后才能写入到内存中,如图2所示。 该方法也能达到较高的可靠性,但将导致30%的性能损失。可见现有容错技 术在确保实现可靠性目标的同时,带来了较大的性能、面积以及功耗方面的 开销。因此,微处理器中需要评测不同的容错技术带来的利与弊。如果采用 严格的容错技术,将引起不必要的开销;反之,如果采用轻量级的容错技术, 则可能达不到系统的可靠性设计目标。微处理器领域中需要一种简单、量化 的评测指标,分析不同结构中发生间歇故障对程序运行的影响,从而指导可 靠性设计。现有技术中使用的评测指标MTTF(Mean Time To Failure,平均 失效时间)或FIT(Failures In Time,即时错误)主要用于表征不同结构 的可靠性,但没有考虑到不同结构对故障的屏蔽效果,以及该些结构的使用 率,不适于描述发生的各种故障对程序运行的影响。
目前研究人员已经提出相关的评测指标,分析不同结构中发生的软错误 对程序执行结果的影响。其中一种评测指标称为体系结构脆弱因子。它表示 微处理器中某结构发生的软错误最终影响程序执行结果的概率。体系结构脆 弱因子越高,表明该结构中发生的软错误越容易导致程序执行出错,相应的 结构需要采取更严格的容错技术,以提高系统的可靠性。计算某结构的体系 结构脆弱因子,可通过分析一段时间内该结构中包含的体系结构正确执行位 进行。体系结构脆弱因子是从体系结构和微体系结构的角度分析发生的软错 误对程序执行结果的影响。分析不同的微处理器结构,以及运行不同的测试 程序时,计算得到的体系结构脆弱因子都将发生变化。另外一个分析软错误 的评测指标为程序脆弱因子,该评测指标仅从体系结构的角度分析程序运行 过程中对软错误的屏蔽效果,便于指导程序设计以及选择编译优化技术,提 高系统的可靠性。
此外针对永久故障,研究人员提出了一种永久故障脆弱因子,该评测指 标主要用于分析比较不同容错技术对系统可靠性提高的程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910241575.1/2.html,转载请声明来源钻瓜专利网。