[发明专利]一种云计算平台的硬盘故障预测方法在审
申请号: | 201410837805.1 | 申请日: | 2015-08-03 |
公开(公告)号: | CN104503874A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 周嵩;王景峰;柏文阳;宋云华 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/34 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种云计算平台硬盘故障预测方法,首先根据预测时间窗口内的硬盘维修记录将硬盘SMART日志数据标记为正常硬盘样本和故障硬盘样本,之后采用K-means聚类算法将去除噪音后的正常硬盘样本划分成k个不相交子集,并分别与故障硬盘样本结合,根据SMOTE过采样算法生成k组平衡训练集,以此训练得到k个支持向量机分类器,用于故障硬盘的预测。在预测阶段,首先采用DBSCAN聚类算法对测试集进行聚类,将聚类簇中的样本预测为正常硬盘样本,而对噪音样本利用训练得到的各个分类器进行预测,并投票得到最终预测结果。本发明的方法实现了利用硬盘SMART数据进行硬盘故障预测,并且能够取得较好的故障查全率和整体性能。 | ||
搜索关键词: | 一种 计算 平台 硬盘 故障 预测 方法 | ||
【主权项】:
一种云计算平台的硬盘故障预测方法,其特征在于,包括以下步骤:步骤一,根据硬盘维修记录,将故障预测时间窗口内发生故障的硬盘的SMART日志数据标记为故障硬盘样本,将没有发生故障的硬盘的SMART日志数据标记为正常硬盘样本;其中,根据硬盘任一时刻的SMART观测值,预测该硬盘从该时刻起的一段时间内是否会发生故障,该段时间就是硬盘故障预测时间窗口;步骤二,对正常硬盘样本采用基于密度的含噪声应用空间聚类算法进行聚类,去除聚类簇之外的噪音样本,保留聚成簇的正常硬盘样本;步骤三,将去噪后的正常硬盘样本采用K‑means算法进行聚类,从而将其划分为k个不相交子集,并分别与故障硬盘样本合并成k个原始训练集,其中k为K‑means聚类的个数,k的取值为小于样本数量的自然数;步骤四,对每个原始训练集中的故障硬盘样本根据少数样本合成过采样技术算法进行过采样,使得训练集中故障硬盘样本与正常硬盘样本的数量一致,从而得到k个平衡训练集;步骤五,分别采用径向基函数内核的LIBSVM工具在k个平衡训练集上训练支持向量机模型,得到集成分类器的k个支持向量机子分类器;步骤六,对测试样本集采用基于密度的含噪声应用空间聚类算法进行聚类,删除聚成簇的样本,保留聚类簇之外噪音样本,并将删除的样本预测为正常硬盘样本;步骤七,将剩余的噪音样本分别用训练阶段得到的k个支持向量机子分类器预测,并投票确定分类结果,若对一个测试样本判断为故障硬盘样本的投票数超过设定的阈值,则预测为故障,否则预测为正常。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410837805.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息诊断方法及系统
- 下一篇:数据同步方法、装置以及系统