[发明专利]一种故障硬盘的定位方法及系统在审
申请号: | 202110800194.3 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113409876A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 彭洁;李宇翔;刘谦;刘畅;曹阳;屈大伟 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G11C29/04 | 分类号: | G11C29/04;G11C29/08;G11C29/20;G11C29/24 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 周初冬 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 硬盘 定位 方法 系统 | ||
本发明提供了一种故障硬盘的定位方法及系统,周期性采集待检测RAID对应的待处理阵列卡日志;解析待处理阵列卡日志,得到在对待检测RAID执行PR前和执行PR后每一硬盘的第一预设指标的第一变化值,及得到在对待检测RAID执行PR时所需的第一执行时长,及得到对待检测RAID执行CC前和执行CC后每一硬盘的第一预设指标的第二变化值,及得到对待检测RAID执行CC时所需的第二执行时长;根据待检测RAID中每一硬盘对应的第一变化值、第一执行时长、第二变化值和第二执行时长,确定待检测RAID中是否存在故障硬盘;若存在,获取故障硬盘对应的硬盘信息,以准确和及时的对故障硬盘进行定位。
技术领域
本发明涉及硬盘故障定位技术领域,具体涉及一种故障硬盘的定位方法及系统。
背景技术
随着计算机技术的发展,服务器对于海量数据的计算需求和存储需求也越来越高,而硬盘作为服务器存储和计算的核心部件,硬盘的稳定运行是保证服务器提供稳定的业务的重要因素,因此如何及时确定硬盘发生故障并及时对发生故障的硬盘进行定位,是目前亟需待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种故障硬盘的定位方法及系统,以及时发现故障硬盘并对其进行定位。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种故障硬盘的定位方法,所述方法包括:
周期性采集待检测独立磁盘冗余阵列RAID对应的待处理阵列卡日志,所述待检测RAID为服务器集群的任一节点服务器中的任一RAID;
解析所述待处理阵列卡日志,得到在对所述待检测RAID执行巡读PR前和执行PR后每一硬盘的第一预设指标的第一变化值,及得到对所述待检测RAID执行PR时所需的第一执行时长,及得到在对所述待检测RAID执行一致性检测CC前和执行CC后每一硬盘的第一预设指标的第二变化值,及得到对所述待检测RAID执行CC时所需的第二执行时长;
根据所述第一执行时长、所述第二执行时长、所述待检测RAID中每一硬盘对应的所述第一变化值和所述第二变化值,确定所述待检测RAID中是否存在故障硬盘;
若存在,获取所述故障硬盘对应的硬盘信息。
优选的,根据所述第一执行时长、所述第二执行时长、所述待检测RAID中每一硬盘对应的所述第一变化值和所述第二变化值,确定所述待检测RAID中是否存在故障硬盘,包括:
针对所述待检测RAID中的每一硬盘,根据所述第一执行时长和所述第二执行时长,结合所述硬盘对应的所述第一变化值和所述第二变化值,判断所述硬盘是否满足预设的故障条件,若满足,确定所述硬盘为故障硬盘;
其中,所述预设的故障条件为:所述第一变化值大于等于第一阈值,所述第二变化值大于等于第二阈值,所述第一执行时长大于等于第三阈值,所述第二执行时长大于等于第四阈值。
优选的,所述第一预设指标至少包括:介质错误计数器、预期错误计数器、其它错误计数器和硬件错误计数器。
优选的,所述周期性采集待检测独立磁盘冗余阵列RAID对应的待处理阵列卡日志之前,还包括:
根据预设的执行时间和执行周期,对待检测RAID执行PR和CC,所述执行时间和所述执行周期基于所述待检测RAID所属的节点服务器对应的第二预设指标和预设信息确定。
优选的,所述第二预设指标至少包括:中央处理器CPU使用率、内存使用率、CUP等待IO、每秒总网卡流量、交换内存swap利用率、磁盘繁忙度和磁盘IO吞吐。
优选的,所述获取所述故障硬盘对应的硬盘信息之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110800194.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能标签粘贴监测方法及系统
- 下一篇:一种评估应用系统健康度的方法及装置