[发明专利]一种恢复服务及性能提升的方法及运维管理系统有效
申请号: | 201610140348.X | 申请日: | 2016-03-11 |
公开(公告)号: | CN107181608B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 姚文辉;刘俊峰;黄硕;朱家稷 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 解婷婷;龙洪 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 恢复 服务 性能 提升 方法 管理 系统 | ||
1.一种恢复服务的方法,应用于运维管理系统,包括:
检测运行状态同步协议的节点集群中节点的状态变化,确定正常节点的个数NN,NN为整数;
如果NN从大于等于S0变为小于S0,进行紧急处理以恢复正常服务,其中,在所述正常节点中包括主节点时,所述紧急处理包括:将配置中心及所述正常节点保存的参数S的值修改为小于或等于NN的正整数值;
其中,参数S表示所述节点集群提供正常服务所要求的同步成功节点的最小个数,S0是根据所述状态同步协议确定的参数S的值。
2.如权利要求1所述的方法,其特征在于:
在所述正常节点中包括主节点时,所述紧急处理还包括:将所述配置中心和所述正常节点保存的参数E的值修改为T-NN’+1,其中,参数E表示所述节点集群选举成功所要求的正常节点的最小个数,NN’为参数S修改为的小于或等于NN的所述正整数值。
3.如权利要求2所述的方法,其特征在于:
所述进行紧急处理以恢复正常服务,其中,在所述正常节点中不包括主节点时,所述紧急处理包括:
将至少FN-floor(T/2)个异常节点的本地日志同步给一个正常节点,同步成功后将所述配置中心和所述正常节点保存的参数E的值修改为NN;及
在所述NN个正常节点选举出新的主节点后,停止服务并执行在所述正常节点中包括主节点时的紧急处理,执行完成后恢复正常服务;
其中,T为所述节点集群的节点数,T≥2,FN为所述节点集群中异常节点的个数,FN=T-NN,floor()表示向下取整。
4.如权利要求3所述的方法,其特征在于:
在所述NN个正常节点选举出新的主节点后停止服务,是通过以下方式实现的:在选举出新的主节点之前,将所述配置中心和所述正常节点保存的参数S的值修改为大于或等于FN+1的值。
5.如权利要求2-4中任一所述的方法,其特征在于:
在NN从大于等于S0变为小于S0,进行紧急处理并恢复正常服务后,还包括:在NN再次发生变化时,比较变化后的NN和S0:
如果NNS0,重新进行所述紧急处理以恢复正常服务;
如果NN≥S0,将所述配置中心和正常节点保存的参数S和参数E的值分别修改为S0和E0;
其中,E0是根据所述状态同步协议确定的参数E的值。
6.如权利要求5所述的方法,其特征在于:
所述节点集群是分布式存储系统中运行Paxos协议或其衍生协议的元数据节点集群,所述同步指日志同步,S0=E0=floor(T/2)+1,floor()表示向下取整。
7.如权利要求2-4、6中任一所述的方法,其特征在于:
对所述配置中心和所述正常节点保存的参数S和/或参数E的值进行修改的过程中,禁止异常节点启动或者禁止断开所述配置中心与所述异常节点的连接。
8.一种运维管理系统,其特征在于,包括状态检测模块、控制模块和紧急处理模块,其中:
所述状态检测模块,用于检测运行状态同步协议的节点集群中节点的状态变化,确定正常节点的个数NN并通知所述控制模块,NN为整数;
所述控制模块,用于在NN从大于等于S0变为小于S0后,调用紧急处理模块进行紧急处理,以恢复正常服务;
所述紧急处理模块,用于在所述正常节点中包括主节点时,执行以下紧急处理:将配置中心及所述正常节点保存的参数S的值修改为小于或等于NN的正整数值;
其中,参数S表示所述节点集群提供正常服务所要求的同步成功节点的最小个数,S0是根据所述状态同步协议确定的参数S的值。
9.如权利要求8所述的运维管理系统,其特征在于:
所述紧急处理模块在所述正常节点中包括主节点时,执行的紧急处理还包括:将所述配置中心和所述正常节点保存的参数E的值修改为T-NN’+1,其中,参数E表示所述节点集群选举成功所要求的正常节点的最小个数,NN’为参数S修改为的小于或等于NN的所述正整数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610140348.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于端到端的应用系统故障定位方法及装置
- 下一篇:通信方法和系统