[发明专利]磁盘故障的预测方法及装置有效
申请号: | 201910844432.3 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110673997B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 来炜国;王磊 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/26 | 分类号: | G06F11/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 磁盘 故障 预测 方法 装置 | ||
本发明提供了一种磁盘故障的预测方法及装置,其方法包括:对获取到的数据集进行预处理,得到样本特征集;根据所述样本特征集,生成时间序列样本集;对所述时间序列样本集中的每一个单位时间内的样本特征进行小波变换,得到每一个单位时间内的样本特征对应的细节系数;将所述细节系数与时间序列样本中的最后一个单位时间的样本特征进行组合,获得故障预测样本集;选择所述故障预测样本集中的测试样本集输入至磁盘故障预测模型中,得到预测值;其中,所述磁盘故障预测模型为一种改进的梯度提升树算法。通过小波变换具有的时‑频多分辨功能的特点,达到当时间序列为非平稳或非线性的时间序列时,提高对磁盘故障预测的准确率的目的。
技术领域
本发明涉及数据存储技术领域,特别涉及一种磁盘故障的预测方法及装置。
背景技术
随着互联网的发展,云计算和大数据越来越受到大众的重视,而存储系统是大数据集群的重要组成部分,一般情况下存储系统由一个或多个磁盘组成,而磁盘很容易受到软硬件故障的影响。一旦磁盘发生故障,将可能导致用户数据丢失或损坏,给用户和服务供应商,造成巨大的损失。
目前,大部分的磁盘在对故障进行预测时,一般采用的故障预测算法都是基于磁盘的硬盘保护技术(Self-MonitoringAnalysisandReporting Technology,SMART)中选择部分属性进行分析,而采用SMART进行预测时,由于机器学习在分类问题上的突出表现,所以使用机器学习来预测磁盘故障为目前主流的方法。但是,由于磁盘SMART属性数据集是一种时间序列,具有非平稳性和非线性特点,导致在采用机器学习来预测磁盘故障的过程中,对磁盘故障预测的准确率较低。
发明内容
有鉴于此,本发明实施例提供一种磁盘故障的预测方法及装置,用于当时间序列为非平稳或非线性的时间序列时,提高对磁盘故障预测的准确率。
为实现上述目的,本发明实施例提供如下技术方案:
一种的磁盘故障的预测方法,包括:
对获取到的数据集进行预处理,得到样本特征集;
根据所述样本特征集,生成时间序列样本集;其中,所述时间序列样本集中包括所述样本特征集中处于预设时间段内的样本特征;
对所述时间序列样本集中的每一个单位时间内的样本特征进行小波变换,得到每一个单位时间内的样本特征对应的细节系数;
将所述细节系数与时间序列样本中的最后一个单位时间的样本特征进行组合,获得故障预测样本集;
选择所述故障预测样本集中的测试样本集输入至磁盘故障预测模型中,得到预测值;其中,所述磁盘故障预测模型为一种改进的梯度提升树算法。
可选的,所述对数据集进行预处理,得到样本特征集,包括:
根据磁盘的时间顺序对获取到的数据集进行升序排列,得到待处理数据集;
将所述待处理数据集输入至预设的树形分类器,由所述树形分类器从所述待处理数据集中的多个属性数据中选择权重最高的预设个数的属性数据作为样本特征集。
可选的,所述得到待处理数据集之前,还包括:
判断磁盘中的数据是否出现空值;
若判断出所述磁盘中的数据出现空值,则采用零值填充;
若判断出所述磁盘中的数据没有出现空值,则判断所述磁盘中的数据记录次数是否低于预设记录次数;
若判断出所述磁盘中的数据记录次数低于预设记录次数,则删除所述数据记录次数低于预设记录次数的磁盘。
可选的,所述磁盘故障预测模型的训练方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910844432.3/2.html,转载请声明来源钻瓜专利网。