[发明专利]一种硬盘监控方法、系统、设备以及介质在审
申请号: | 202111229365.8 | 申请日: | 2021-10-21 |
公开(公告)号: | CN114116374A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 苏军 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32;G11B33/14 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛;杨帆 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 硬盘 监控 方法 系统 设备 以及 介质 | ||
本发明公开了一种硬盘监控方法,包括以下步骤:获取监控参数;根据所述监控参数配置对应的阈值、采集间隔以及每一个监控参数对应的告警策略;根据每一个监控参数对应的所述采集间隔分别周期性采集对应的值;根据将每一个监控参数对应的告警策略、周期性采集到的多个值以及对应的阈值判断是否触发告警;响应于触发告警,上报告警信息。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案考虑影响SSD盘运行的多样性,因此从多个维度来分析SSD的现状,并及时在预测出SSD盘失效时上报告警信息。
技术领域
本发明涉及硬盘领域,具体涉及一种硬盘监控方法、系统、设备以及存储介质。
背景技术
随着互联网、云计算、物联网等技术的发展及广泛应用,在人类生活中,时时刻刻都会产生海量的数据需要处理及存储,信息技术的高速发展对存储系统的性能提出了更高的要求。固态硬盘因其读写速度快、能耗较低,而被广泛采用。随着PE(programeraseendurance写擦的忍耐程度)的增加,受到Tcross(温度交叉,即读和写的温度存在差异)、read disturb(读干扰)、DATAretention(数据保持)等的影响,NAND可能处于不稳定状态,表现为触发较多的数据纠错流程,甚至出现数据解码失败的场景,这些都是SSD盘运行异常的表现,影响到SSD盘的可靠性。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种硬盘监控方法,包括以下步骤:
获取监控参数;
根据所述监控参数配置对应的阈值、采集间隔以及每一个监控参数对应的告警策略;
根据每一个监控参数对应的所述采集间隔分别周期性采集对应的值;
根据将每一个监控参数对应的告警策略、周期性采集到的多个值以及对应的阈值判断是否触发告警;
响应于触发告警,上报告警信息。
在一些实施例中,根据每一个监控参数对应的所述采集间隔分别周期性采集对应的值,进一步包括:
获取每一个物理LUN上当前的坏块数量;
响应于检测到新增坏块,根据对应的物理LUN上当前的坏块数量得到累计坏块数量。
在一些实施例中,根据将每一个监控参数对应的告警策略、周期性采集到的多个值以及对应的阈值判断是否触发告警,进一步包括:
响应于所述对应的物理LUN上当前的坏块数量得到累计坏块数量大于坏块数量阈值,触发一级告警。
在一些实施例中,根据每一个监控参数对应的所述采集间隔分别周期性采集对应的值,进一步包括:
周期性获取每一种纠错类型当前的计数;
计算每一个纠错类型在相邻两次周期内获取到计数的增幅。
在一些实施例中,根据将每一个监控参数对应的告警策略、周期性采集到的多个值以及对应的阈值判断是否触发告警,进一步包括:
响应于计数的增幅大于增幅阈值,根据计数的增幅大小触发相应等级的告警。
在一些实施例中,根据每一个监控参数对应的所述采集间隔分别周期性采集对应的值,进一步包括:
周期性采集每一个温度传感器的温度以及计算每一个温度传感器与其他传感器之间的差值。
在一些实施例中,根据将每一个监控参数对应的告警策略、周期性采集到的多个值以及对应的阈值判断是否触发告警,进一步包括:
判断温度传感器的值是否达到温度阈值以及判断差值是否大于温差阈值;
响应于温度传感器的值达到温度阈值,上报温度异常;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111229365.8/2.html,转载请声明来源钻瓜专利网。