[发明专利]一种硬盘状态监控方法和装置有效
申请号: | 201810212464.7 | 申请日: | 2018-03-15 |
公开(公告)号: | CN108415810B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 包卫东;朱晓敏;王吉;周文;张耀鸿;陈超;马力;张国良;陈俊杰;杨骋;吴冠霖;韩浩然 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34;G06N3/04 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 410003 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 硬盘 状态 监控 方法 装置 | ||
本发明公开了一种硬盘状态监控方法和装置,所述方法包括:周期性获取被监测硬盘的不同的SMART属性值;在每次获取所述硬盘的SMART属性值后进行如下操作:根据当前获取的所述硬盘的SMART属性值,得到该硬盘的属性集成;将所述属性集成输入到引入门控递归单元的递归神经网络中,将所述递归神经网络的隐层状态作为输出;根据从所述递归神经网络的输出中获取的信息,监控所述硬盘是否将出现故障状态。应用本发明可以对硬盘驱动器的正常状态的偏差可以追溯到更早的时期,以利于提高故障检测率或故障预测能力。
技术领域
本发明涉及硬盘故障监控技术领域,特别是指一种硬盘状态监控方法和装置。
背景技术
在大数据时代,配备大型存储系统的数据中心在存储和处理数据方面起着重要的作用。然而,复杂的系统引起了IT设备故障的严重问题,其中硬盘是最常见的故障组件。虽然单个硬盘故障可能是比较罕见的,但成千上万个硬盘垒叠在一起,放大了失效的概率,使得在数据中心存储系统中,故障事件成为普遍而不是例外。考虑到数据丢失和服务中断造成的巨大的经济损失,硬盘可靠性问题是数据中心管理员最关心的问题之一。
目前,几乎所有的硬盘都配备有自我监控、分析和报告技术(SMART)来检测和报告各种驱动器可靠性指标。研究表明,硬盘可以通过SMART数据预示即将出现的故障。它甚至被一些硬盘制造商作为产品中内置的故障预测模型。然而,内置模型仅仅提供了一个基本的基于阈值的评估,其失效预测能力相当弱。为了提高故障预测能力,研究者们提出了基于SMART数据的统计学和机器学习方法。虽然这些方法在故障检测率和误报率方面表现出良好的性能,但仍然存在一些关键的尚未解决的挑战:
故障硬盘往往经历一个从健康到故障的劣化的进程。但是大多数现有的方法都是基于SMART(Self-Monitoring Analysis and Reporting Technology,自动检测分析及报告技术)数据的一个时间戳来预测故障,忽略了时间上的退化过程。基于马尔可夫模型和简单递归神经网络(RNN)的一些方法,试图捕捉SMART数据中的时间依赖性。然而,受限于这些模型的固有的问题,例如RNN中梯度消失与梯度爆炸问题,这些方法只能捕捉几天内短期的时间依赖性。
然而,根据本发明的发明人的观察和分析,某些硬盘驱动器的正常状态的偏差可以追溯到几十天甚至数月,这大大超过了这些方法的能力。
发明内容
有鉴于此,本发明的目的在于提出一种硬盘状态监控方法和装置,可以对硬盘驱动器的正常状态的偏差可以追溯到更早的时期,以利于提高故障检测率或故障预测能力。
基于上述目的本发明提供一种硬盘状态监控方法,包括:
周期性获取被监测硬盘的不同的SMART属性值;在每次获取所述硬盘的SMART属性值后进行如下操作:
根据当前获取的所述硬盘的SMART属性值,得到该硬盘的属性集成;
将所述属性集成输入到引入门控递归单元的递归神经网络中,将所述递归神经网络的隐层状态作为输出;
根据从所述递归神经网络的输出中获取的信息,监控所述硬盘是否将出现故障状态。
其中,所述根据当前获取的所述硬盘的SMART属性值,得到该硬盘的属性集成,具体为:
根据当前获取的所述硬盘的第t天的SMART属性值所组成的SMART向量得到的属性集成表示为根据如下表达式一计算得到:
vt=ReLU(WVst+bv) (表达式一)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810212464.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有报警功能的计算机设备
- 下一篇:一种监测业务逻辑的方法及装置