[发明专利]服务器集群硬盘故障处理方法、装置、电子设备及存储介质在审
申请号: | 202010779444.5 | 申请日: | 2020-08-05 |
公开(公告)号: | CN111897686A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 牛犇;刘抗抗;陈海超;林哲伟;赵亮;严勇;刘裕勋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/32 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 集群 硬盘 故障 处理 方法 装置 电子设备 存储 介质 | ||
1.一种服务器集群硬盘故障处理方法,其特征在于,所述方法包括:
获取服务器集群硬盘的故障警示信息;
响应于所述服务器集群硬盘的故障警示信息,调用所述服务器集群硬盘的运行数据;
基于所述服务器集群硬盘的运行数据,确定所述服务器集群硬盘故障的类型;
当所述服务器集群硬盘故障的类型为不可用告警时,触发相匹配的无硬件故障检测进程,获取所述无硬件故障检测进程的检测结果;
基于所述无硬件故障检测进程的检测结果,对所述服务器集群硬盘故障进行修复。
2.根据权利要求1所述的方法,其特征在于,所述获取服务器集群硬盘的故障警示信息,包括:
监听所述服务器集群硬盘的运行参数,当所述服务器集群硬盘的运行参数达到警示阈值时,触发所述服务器集群硬盘的故障警示信息;或者
接收服务器集群用户报警信息,并基于所述服务器集群用户的参数,确定与所述服务器集群用户相匹配的服务器集群硬盘,触发所述服务器集群硬盘的故障警示信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述服务器集群硬盘的运行数据,确定所述服务器集群硬盘故障的类型,包括:
确定所述服务器集群硬盘的硬盘属性参数,其中,所述硬盘属性参数包括:硬盘型号、服务器型号、上架时间、版本号以及硬盘的分区标识;
基于所述服务器集群硬盘的硬盘属性参数,调取相应存储介质中所保存的所述服务器集群硬盘的运行数据;
根据所述服务器集群硬盘的硬盘属性参数,获取对应的故障类型特征;
通过对所述服务器集群硬盘的运行数据与所述故障类型特征的交叉比对,确定所述服务器集群硬盘故障的类型,其中,所述服务器集群的故障类型包括:不可用告警和失效告警。
4.根据权利要求1所述的方法,其特征在于,所述当所述服务器集群硬盘故障的类型为不可用告警时,触发相匹配的无硬件故障检测进程,获取所述无硬件故障检测进程的检测结果;
当所述服务器集群硬盘故障的类型为不可用告警时,通过触发相匹配的无硬件故障检测进程,获取与所述服务器集群硬盘相匹配的检测参数;
对所述服务器集群硬盘相匹配的检测参数进行多维度处理,确定所述服务器集群硬盘在不同维度中的检测结果;
对所述服务器集群硬盘在不同维度中的检测结果进行融合处理,确定所述无硬件故障检测进程的检测结果。
5.根据权利要求4所述的方法,其特征在于,所述对所述服务器集群硬盘相匹配的检测参数进行多维度处理,确定所述服务器集群硬盘在不同维度中的检测结果,包括:
基于所述服务器集群硬盘对应的硬盘保护参数,确定相应的参数健康检测结果;
通过对所述硬盘保护参数的标准化处理,确定所述硬盘保护参数的分布特征检测结果;
通过对所述硬盘保护参数的动态斜率处理,确定所述硬盘保护参数的恶化趋势结果;
通过对所述硬盘保护参数的预测函数处理,确定所述硬盘保护参数对应的故障概率结果;
对所述参数健康检测结果、分布特征检测结果、恶化趋势结果以及故障概率结果进行融合处理,确定所述服务器集群硬盘在不同维度中的检测结果。
6.根据权利要求1所述的方法,其特征在于,所述基于所述无硬件故障检测进程的检测结果,对所述服务器集群硬盘故障进行修复,包括:
基于所述无硬件故障检测进程的检测结果,确定所述服务器集群硬盘相匹配的故障修复方式;
基于与所述服务器集群硬盘相匹配的故障修复方式,触发对应的故障修复进程,并通过所述故障修复进程对所述服务器集群硬盘故障进行修复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010779444.5/1.html,转载请声明来源钻瓜专利网。