[发明专利]一种分布式存储系统管理方法及其装置有效
申请号: | 201710911390.1 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107453932B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 樊云龙 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;李丹 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 存储系统 管理 方法 及其 装置 | ||
本发明公开了一种分布式存储系统管理方法及其装置。该方法,包括:获取集群中一监控节点的异常状态信息,所述异常状态信息至少包括以下任意一项或其组合:服务状态信息,节点存活信息;根据所述异常状态信息,确定所述集群中一非监控物理节点为临时监控节点,并确定所述监控节点为异常监控节点。实现了在监控节点正常工作时,确定一非监控物理节点为临时监控节点,避免了CEPH集群中N/2‑1个以上的监控节点发生故障,从而实现了CEPH集群的正常工作。
技术领域
本发明涉及存储技术,尤指一种分布式存储系统管理方法及其装置。
背景技术
随着分布式存储系统的广泛应用,人们提出了分布式文件系统(CEPH),其中,CEPH包括三个部分:对象存储设备(Object Storage Device,简称OSD),监控节点(Monitor),元数据服务器(Metadata server cluster,简称MDS)。OSD是底层对象存储系统,Monitor是集群管理系统,MDS是用来支持可移植操作系统接口POSIX文件接口的元数据MetadataServer。
现有技术中,CEPH集群中部署有若干个Monitor,由其共同负责整个Ceph集群中所有OSD状态的发现与记录。在CEPH集群中,通过Paxos算法在众多Monitor中确定出Leader,以及确定支持Leader节点当选Leader的Monitor为Quorum成员,其中,选出Leader的前提是CEPH集群中Quorum成员的个数大于N/2+1,N为Monitor节点个数。
然而,若CEPH集群中N/2-1个以上的Monitor发生故障时,整个集群将不能对外提供任何服务,导致CEPH集群无法正常工作。
发明内容
为了解决上述技术问题,本发明提供了一种分布式存储系统管理方法及其装置,用以解决CEPH集群无法正常工作的问题。
为了达到本发明目的,本发明提供了一种分布式存储系统管理方法,包括:
获取集群中一监控节点的异常状态信息,所述异常状态信息至少包括以下任意一项或其组合:服务状态信息,节点存活信息;
根据所述异常状态信息,确定所述集群中一非监控物理节点为临时监控节点,并确定所述监控节点为异常监控节点。
进一步的,所述根据所述异常状态信息,确定所述集群中一非监控物理节点为临时监控节点,包括:
确定所述集群中是否存在优先级最高的非监控物理节点,物理节点的优先级与所述物理节点关联的对象存储设备OSD的个数呈正相关性;
若存在,则确定优先级最高的非监控物理节点为所述临时监控节点;
若不存在,则确定所述异常监控节点所在的物理主机为所述临时监控节点。
进一步的,所述根据所述异常状态信息,确定所述集群中一非监控物理节点为临时监控节点之后,还包括:
确定所述异常监控节点在一时长范围内是否正常工作;
若是,则将所述临时监控节点从所述集群中删除;
若否,则确定所述临时监控节点为正式监控节点,将所述异常监控节点从所述集群中删除。
进一步的,所述获取集群中一监控节点的异常状态信息之后,还包括:
重启所述异常监控节点;
确定一时长后,所述控制节点无法正常工作。
进一步的,所述获取集群中一监控节点的异常状态信息之前,还包括:
通过虚拟化管理平台对所述集群进行控制;
将所述集群中监控节点以虚拟机的形式进行部署于虚拟化管理平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710911390.1/2.html,转载请声明来源钻瓜专利网。