[发明专利]一种服务器硬盘的维护方法、系统及服务器监控设备在审
申请号: | 201310629347.8 | 申请日: | 2013-11-29 |
公开(公告)号: | CN104679623A | 公开(公告)日: | 2015-06-03 |
发明(设计)人: | 唐华斌;邓超;郁志强 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李姜 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 硬盘 维护 方法 系统 监控 设备 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务器硬盘的维护方法、系统及服务器监控设备。
背景技术
硬盘是服务器中相对故障率较高的部件,需要对服务器集群中的硬盘进行维护,一般来说,对硬盘的维护包括两方面内容:
一方面是对硬盘中存储的数据的维护。
为了避免出现硬盘故障导致数据丢失的情况,可通过诸如多副本存储的方式,将相同内容的数据分别存储在多个服务器的硬盘中,即使某一个硬盘出现故障,导致故障硬盘中存储的数据丢失,但是丢失的数据在其他硬盘中的存储仍然能够保证数据的完整性和可用性;同时,当服务器集群中的管理设备检测出故障硬盘(即管理设备将无法读写的硬盘作为故障硬盘)时,可在其他可用的硬盘中重构故障硬盘中丢失的数据,确保服务器集群中该数据始终有多副本的存储,保证数据存储的安全性。
另一方面是硬盘的硬件维护。
当服务器集群中出现故障的硬盘累计到一定数量后,服务器集群的管理人员将对故障的硬盘进行批量更换。此时,可能出现在服务器集群中故障硬盘的总量并不多,无需进行批量更换,但某一服务器中却有若干个故障硬盘,导致该服务器由于故障硬盘数量多出现了存储容量吃紧的问题。
由于支持热插拔的服务器的硬盘密度较低,因此,一般采用不支持热插拔的服务器,所谓不支持热插拔,就是当更换服务器中故障硬盘时,需要将故障硬盘所在的服务器下电,同时,需对下电的服务器中原本正常运行的硬盘中的数据进行异地重构。按照批量更换故障硬盘的方式对硬盘进行维护时,如果一次性有多台服务器下电,就需要在短时间内对大量的原本正常运行的硬盘中的数据进行异地重构,这会对整个服务器集群和通信网络造成强烈冲击,不利于服务器集群和通信网络的稳定性。
发明内容
本发明实施例提供一种服务器硬盘的维护方法、系统及服务器监控设备,用以解决现有技术中存在的服务器由于故障硬盘数量多出现了存储容量吃紧,以及短时间内进行大量异地重构而对整个服务器集群和通信网络造成强烈冲击的问题。
本发明实施例采用以下技术方案:
一种服务器硬盘的维护方法,所述方法包括:
获取服务器集群中各服务器的硬盘状态信息,所述硬盘状态信息包括服务器中故障硬盘的数量和未故障硬盘的运行状态;
根据各服务器的硬盘状态信息和预设的下电维护条件,确定需要进行下电维护的服务器;
向确定的服务器发送下电指示消息,使接收到下电指示消息的服务器进行下电维护。
在本发明实施例中,避免了当某一服务器的故障硬盘较多但服务器集群的故障硬盘数不满足批量更换条件的情况下,不对该服务器进行硬盘维护导致该服务器的容量吃紧的问题;同时,还将服务器的维护过程变得分散,相较于批量更换硬盘时,避免大量的数据重构操作对服务器集群和通信网络造成的冲击,有利于服务器集群和通信网络的稳定性。
优选地,根据服务器的硬盘状态信息和预设的下电维护条件,确定需要进行下电维护的服务器,具体包括:
在所述下电维护条件为服务器的硬盘可用率未达到设定门限值时,将可用率未达到所述设定门限值的服务器确定为需要进行下电维护的服务器;
服务器的硬盘可用率通过以下公式确定:
其中,AR为服务器的硬盘可用率;pi%为第i个未故障硬盘出现故障的概率;所述未故障硬盘出现故障的概率是根据未故障硬盘的运行状态确定的;M为服务器的硬盘总数;N为故障硬盘的数量。
在本发明实施例中,通过预设的下电维护条件来确定需要进行下电维护的服务器,可以根据实际需要灵活设定下电维护条件。
优选地,根据服务器的硬盘状态信息和预设的下电维护条件,确定需要进行下电维护的服务器,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司;,未经中国移动通信集团公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310629347.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多航天器并行测试过程的效能评价方法
- 下一篇:数据资源复制方法以及装置