[发明专利]减少业务中断时间的方法和装置有效
申请号: | 200710135751.4 | 申请日: | 2007-08-10 |
公开(公告)号: | CN101106441A | 公开(公告)日: | 2008-01-16 |
发明(设计)人: | 张志龙 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L1/22 | 分类号: | H04L1/22;H04B1/74;H04B17/00 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 减少 业务 中断 时间 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种减少业务中断时间的方法和装置。
背景技术
软失效是基于带RAM(Random Access Memory,随机存储器)等存储内存器件特有的失效模式,和硬失效相对应,硬失效是器件的硬件本身发生故障,除此之外,对于器件不能正常运行的情况都称为软失效。通常,器件的工作电压越低,工艺线宽越窄,或者器件工作环境所处的位置海拔越高时,器件的软失效概率越大。例如,采用0.13微米技术的存储器,其软失效的概率高达每兆位10000~100000FITs(Failures In Time,菲特),相当于平均几个月或者几个星期就可能会出现一次软失效。
目前,为了减小由于器件的软失效带来的严重性,一般会在单板等设备上增加一片或多片存储内存用于检测器件软失效,为了方便说明,本申请将增加的所述用于检测器件软失效的内存统称为ECC(Error Checking andCorrecting,检错或纠错)内存,所述ECC内存能够检测设备上的一个或多个器件。单板在每次启动或复位时,所述ECC内存都要对该单板中的器件进行检测,当所述ECC内存检测出单板故障时,单板会重新启动或复位,然后重新进行检测,直到检测正常。
然而,在进行本发明创造过程中,发明人发现现有技术中至少存在如下问题:
由于ECC内存在每次单板启动或重启时,对单板上的RAM器件进行检测,当出现故障,则重新启动该单板。现有技术中无论这种故障是单板上的器件导致还是ECC内存本身出现故障,只要检测不通过,则会重复启动。
因此,如果是由于ECC内存本身出现的故障,而设备单板除ECC内存外的其他器件完全正常,即能够正常执行业务,那么也会由于该ECC内存故障,而导致该单板的业务中断。而这时,只能通过更换设备的单板或者通过冗余系统的倒换等方式,才能使中断的业务恢复正常。因此增大了MTTR(MeanTime To Repair,平均故障修复时间),降低了设备的可用度和运行的可靠性。
发明内容
本发明一个或多个实施例的目的在于提供一种减少业务中断时间的方法和装置,以达到通过及时检测出ECC内存故障,而减少设备业务中断时间的目的。
为解决上述问题,本发明实施例提供了一种减少业务中断时间的方法,包括:
当设备因故障而无法正常启动时,判断所述故障是否是由该设备的ECC内存引发,若是,则关闭所述ECC内存的运行;
触发设备重新启动,以在启动后恢复业务运行。
基于上述技术方案,本发明实施例还提供了一种对设备ECC内存故障检测的方法,包括:
当设备因故障而无法正常启动时,关闭设备中ECC内存的运行;
触发设备重新启动,并
检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
基于上述技术方案,本发明实施例还提供了一种用于减少业务中断时间的装置,包括:
触发单元,用于当获知设备因故障而无法正常启动时,向判断单元发送触发信号;
判断单元,用于在收到所述触发信号后,判断所述故障是否是由该设备的ECC内存引发,若是,则判断得到ECC内存故障消息;
ECC内存控制单元,用于在收到所述ECC内存故障消息后,关闭所述ECC内存的运行,并触发设备重新启动,以在启动后恢复业务运行。
基于上述技术方案,本发明实施例还提供了一种用于检测设备ECC内存故障的装置,包括:
触发单元,用于当获知设备因故障而无法正常启动时,向ECC内存控制单元发送触发信号;
所述ECC内存控制单元,用于在收到所述触发信号后,关闭所述ECC内存的运行,并触发设备重新启动,同时通知检验单元进行检验;
检验单元,用于在收到所述通知后,检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
与现有技术相比,本发明实施例具有以下优点:
本发明在当设备发生故障时,能够及时将检测到出现故障的ECC内存关闭,从而使得设备再启动后,能够不运行故障的ECC内存,而正常启动,并且恢复业务运行。本发明能够在设备出现故障时,排查故障,并尽可能地克服设备故障,保证设备的正常运行,从而避免了设备业务的长时间中断,减少了设备的业务中断时间。
附图说明
图1为本发明减少业务中断时间的一种方法实施例的流程图;
图2为本发明减少业务中断时间的另一种方法实施例的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710135751.4/2.html,转载请声明来源钻瓜专利网。