[发明专利]一种集群内的节点管理方法及节点设备有效
申请号: | 201610416731.3 | 申请日: | 2016-06-14 |
公开(公告)号: | CN107508694B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 骆旭剑 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 梁嘉琦 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 节点 管理 方法 设备 | ||
本发明公开了一种集群内的节点管理方法及节点设备,所述方法包括:第一节点检测到节点间心跳连接异常时,依据第一管理策略确定所述第一节点为所在子群的预备管理节点;基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,确定所述第一节点可以由预备管理节点转换成管理节点时,作为管理节点对集群资源进行节点间的重配置及节点间任务调度。
技术领域
本发明涉及通信技术领域,尤其涉及一种集群内的节点管理方法及节点设备。
背景技术
为了使集群的整体服务尽可能可用,当高可用性集群中的节点发生故障时,集群系统应该迅速做出反应,将该系统的任务分配到集群中其它正在工作的节点上执行,而故障节点的共享资源(比如IP、磁阵)也会被其他节点接管。
一般的,高可用性集群中节点间使用心跳(heartbeat)检测节点的情况,然而在心跳失效的时候,可能会发生脑裂(split-brain)问题。脑裂会引起数据的不完整性,并且可能会对服务造成严重影响,一个高可用性集群,不可避免要面对脑裂问题,目前,针对脑裂问题有一些解决方案:
1)添加冗余的心跳,然而这只能减少而不能避免脑裂;
2)做好对裂脑的监控报警,如邮件以及手机短信等,在问题发生的时候能够人为的介入到仲裁,降低损失,然而这需要人工参与;
3)启用磁盘锁,正在服务一方锁住共享磁盘,脑裂发生的时候,让对方完全抢不走共享的磁盘资源,然而如果占用共享磁盘的一方不主动解锁,另一方就永远得不到共享磁盘,如果占用共享磁盘的节点突然死机或者崩溃,另一方不可能执行解锁命令,后备节点也就接管不了共享的资源和应用服务;
4)增加第三方仲裁的机制,确定资源获得者,然而这需要引入第三方,且第三方如果发生故障,脑裂问题变无法解决。
综上所述,提供一种集群内的节点管理方案,能够在集群节点异常情况下利用集群已有的节点设备进行节点管理,避免脑裂问题的发生,已成为亟待解决的问题。
发明内容
本发明实施例提供一种集群内的节点管理方法及节点设备,至少解决了现有技术中存在的问题,能够在不引入第三方设备的情况下,利用集群现有的资源有效地解决脑裂问题,保证集群的高可用性和可靠性。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种集群内的节点管理方法,所述方法应用于第一节点,所述方法包括:
检测到节点间心跳连接异常时,依据第一管理策略确定所述第一节点为所在子群的预备管理节点;
基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,确定所述第一节点可以由预备管理节点转换成管理节点时,作为管理节点对集群资源进行节点间的重配置及节点间任务调度。
上述方案中,所述检测到节点间心跳连接异常之前,所述方法还包括:
依据第三管理策略确定第二节点为管理节点,以使所述第二节点进行资源配置及任务调度。
上述方案中,所述基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,包括:
基于预设的网络检测方式判断所述第一节点是否存在对外网络连接,判断为是时,确定所述第一节点可以转换成管理节点;判断为否时,确定所述第一节点不能转换成管理节点。
上述方案中,所述集群内的共享存储设备支持多节点共同访问;
所述基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610416731.3/2.html,转载请声明来源钻瓜专利网。