[发明专利]存储系统故障预测方法和装置无效
申请号: | 201310030555.6 | 申请日: | 2013-01-25 |
公开(公告)号: | CN103116531A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 王佳 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F11/00 | 分类号: | G06F11/00 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;曲鹏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储系统 故障 预测 方法 装置 | ||
技术领域
本发明涉及计算机应用领域,尤其涉及一种存储系统故障预测方法和装置。
背景技术
随着互联网和电子商务的快速发展,网络数据信息呈现爆炸性增长趋势,存储网络技术越来越被企业所接受,并在企业的商业活动中充当非常重要的角色。构建高可用性的存储网络是至关重要的,若存储网络系统发生故障,如服务器故障或各种设备故障,造成系统服务中断将会造成客户的流失和企业收入的损失。研究表明,在网络存储系统中,若系统发生1小时的停机,企业将损失15万美元到645万美元之间。为了保证企业达到24小时*365天的应用需求,必须构建高可用存储系统。
实现高可用存储系统的关键技术之一是故障的失效检测。通过失效检测技术,可以及时发现系统的故障设备、节点或应用程序,然后通过资源切换、状态恢复或重启,来保证系统服务的连续性。
高可用存储系统中的故障发展呈现出以下特点:
1、具有突发性,并可在短时间内产生大量数据丢失,造成业务中断。例如:银行系统掉电故障;
2、具有滞后性,使得存储系统不会及时发现故障,故障不断注入,造成系统业务运行不顺畅,甚至中断时间较长。例如:网线被拔出;
3、故障对节点上运行的其他程序影响范围越来越大,例如:CPU的不断升高,内存的不断降低,必然成为其他程序正常运行的瓶颈;
4、具有多样性,使得存储系统对故障检测识别度降低,易有遗漏。
系统故障的突发性和滞后性使其成为高可用存储系统的杀手锏,如何有效地检测及预测故障,提供一种灵活的故障预测机制成为衡量存储系统高可用性好坏的标准。目前,高可用存储系统中,对于节点自身故障的处理是通过系统中其他节点来判断,其他节点如果在超时时间仍收不到该节点的心跳,则认为该节点出现故障,以进行故障处理和资源切换。而这种方式属于故障发现故障再处理,即对于已出现的故障进行分析,并不能对故障的发展趋势进行预测,会使得业务中断时间延时,无法满足高可用性要求高的存储系统。
发明内容
本发明提供了一种存储系统故障预测方法和装置,解决了现有处理方式无法满足高可用性要求高的存储系统的问题。
一种系统故障预测方法,包括:
收集系统内不同故障类型的故障信息;
对各个故障类型的故障信息分别进行预处理,获取各故障类型下的子故障类型和各子故障类型对应的故障发生的时间序列;
预测所述子故障类型对应的故障的下一次发生时间。
优选的,所述故障类型包括处理器(CPU)故障、内存故障、文件访问故障、网卡流量故障和主机硬件故障。
优选的,对各个故障类型的故障信息分别进行预处理,获取各故障类型下的子故障类型和各子故障类型对应的故障发生的时间序列包括:
获取各故障类型的聚类信息,所述聚类信息包括相关系数、最大值、最小值、中间值、平均值、出现频率最高的值和标准差;
分别对各故障类型的聚类特征使用K-MEANS聚类算法进行聚类,将每个故障类型细化成多个具有相似聚类特征的子故障类型;
获取各子故障类型中故障发生的时间序列。
优选的,所述预测所述子故障类型对应的故障的下一次发生时间具体为:
构建ARIMA模型;
检测所述ARIMA模型的有效性;
在所述ARIMA模型有效时,使用子故障类型中故障发生的时间序列作为输入,预测下一次所述子故障类型对应的故障发生的时间。
优选的,所述使用子故障类型中故障发生的时间序列作为输入,预测下一次所述子故障类型对应的故障发生的时间包括:
从所述时间序列中提取当前时刻的前p个数据点代入所述ARIMA模型,预测出下q个时刻的故障值及其置信区间,其中p>q>0。
优选的,所述检测所述ARIMA模型的有效性的步骤之后,还包括:
在所述ARIMA模型无效时,重新估计该ARIMA模型的参数。
优选的,所述预测所述子故障类型对应的故障的下一次发生时间的步骤之后,还包括:
验证当前时刻的实际故障值是否偏离所述置信区间;
在所述当前的实际故障值偏离所述置信区间时,判定故障异常,通过邮件日志、系统日志、短信通知进行故障报警,并进行故障数据处理。
优选的,所述预测所述子故障类型对应的故障的下一次发生时间的步骤之后,还包括:
验证当前时刻的实际故障值是否偏离所述置信区间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310030555.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:便捷式食品包装瓶
- 下一篇:一种带弹簧瓶底结构的注吹拉模具