[发明专利]用于支持盘故障预测的方法、设备和计算机程序产品在审
申请号: | 201811261806.0 | 申请日: | 2018-10-26 |
公开(公告)号: | CN111104293A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 刘冰;刘星宇 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;罗利娜 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 支持 故障 预测 方法 设备 计算机 程序 产品 | ||
1.一种支持盘故障预测的方法,包括:
获取与多个盘相关联的操作信息和故障信息,所述多个盘包括由所述故障信息指示存在故障的第一组盘和由所述故障信息指示不存在故障的第二组盘;
基于与包括所述第一组盘的相应存储系统相关的系统上下文信息,确定与所述第一组盘相关联的故障信息的有效性;以及
响应于确定与所述第一组盘中的至少一个盘相关联的故障信息有效,基于与所述至少一个盘和所述第二组盘相关联的操作信息和故障信息来确定机器学习模型,所述机器学习模型具有从盘的操作信息预测盘的故障的能力。
2.根据权利要求1所述的方法,其中所述系统上下文信息包括指示所述相应存储系统中至少一个存储系统所使用的盘固件出错的固件错误信息,确定与所述第一组盘相关联的故障信息是否有效包括:
基于所述固件错误信息,确定与所述第一组盘中使用出错的所述盘固件的盘相关联的故障信息无效。
3.根据权利要求1所述的方法,其中所述系统上下文信息包括所述相应存储系统的拓扑信息和指示所述相应存储系统中的连接组件是否存在故障的另一故障信息,确定与所述第一组盘相关联的故障信息的有效性包括:
响应于所述另一故障信息指示所述连接组件存在故障,基于所述拓扑信息标识所述第一组盘中无需经由所述连接组件可访问的至少一个盘;以及
确定与所标识的至少一个盘相关联的故障信息有效。
4.根据权利要求1所述的方法,其中所述系统上下文信息包括所述相应存储系统的故障盘的预定故障率,所述故障信息还指示所述第一组盘的故障的发生时间,确定与所述第一组盘相关联的故障信息的有效性包括:
确定在预定时间段内所述相应存储系统的故障率是否超过所述预定故障率,所述预定时间段包括所述发生时间;以及
响应于确定至少一个存储系统的故障率未超过所述预定故障率,确定与所述第一组盘中由所述至少一个存储系统包括的盘相关联的故障信息有效。
5.根据权利要求1所述的方法,其中确定所述机器学习模型还包括:
还基于第一性能度量来确定所述机器学习模型,所述第一性能度量指示所述机器学习模型将所述第一组盘中的所述至少一个盘正确检测为存在故障的概率或者将所述第二组盘错误检测为存在故障的概率。
6.根据权利要求1所述的方法,还包括:
基于与所述至少一个盘和所述第二组盘相关联的操作信息和故障信息以及第二性能度量来确定另一机器学习模型,所述第二性能度量指示所述另一机器学习模型将所述第一组盘中的所述至少一个盘正确检测为存在故障的概率或者将所述第二组盘错误检测为存在故障的概率;
其中所述机器学习模型和所述另一机器学习模型基于与待检测盘所在的待检测存储系统的稳定性水平相对应的性能度量而被选择用于预测所述待检测盘的故障。
7.根据权利要求6所述的方法,其中所述待检测存储系统的稳定性水平基于所述待检测存储系统中已经故障的盘的数目被确定。
8.根据权利要求1所述的方法,其中所述机器学习模型基于以下至少一项:随机森林模型、支持向量机模型和神经网络模型。
9.根据权利要求1所述的方法,其中所述操作信息包括以下至少一项:在所述多个盘的操作期间记录的操作状态统计信息、所述多个盘的类型、所述多个盘的型号、以及所述多个盘的供应商。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811261806.0/1.html,转载请声明来源钻瓜专利网。