[发明专利]集群监测和切换方法及装置在审
申请号: | 201611184874.2 | 申请日: | 2016-12-20 |
公开(公告)号: | CN108206768A | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 孟庆义 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;H04L29/08 |
代理公司: | 北京市惠诚律师事务所 11353 | 代理人: | 逯博 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集群 分区 监测 服务请求 监控节点 出错率 可用 服务状态 集群可用性 可用性 服务能力 集群服务 监测结果 响应 客户端 客户 统计 成功 | ||
1.一种集群监测方法,其特征在于,所述方法包括:
监控节点分别监测集群内各分区的服务状态,和/或所述集群对客户端的服务请求响应情况;
所述监控节点计算处于服务状态的分区数量与分区总数之比,以得到集群的分区可用率;和/或,所述监控节点统计所述集群所接收到的客户端服务请求中,未成功进行响应的服务请求,以得到集群的请求出错率;
根据所述集群的分区可用率,和/或请求出错率,所述监控节点确定所述集群的可用性。
2.根据权利要求1所述的集群监测方法,其特征在于,所述集群包括主节点和数据节点;所述监控节点分别监测集群内各分区的服务状态,和/或所述集群对客户端的服务请求响应情况,包括:
所述集群中的各个数据节点向对应的主节点发送运行数据;所述运行数据包括:所述数据节点所维护的分区的总数和所维护的分区中可用分区的数量;和/或,所述运行数据包括:异常响应的客户端服务请求数量和接收到客户端请求的总数;
所述主节点对所接收到的各个数据节点的运行数据进行汇总;
所述监控节点从所述主节点获取汇总后的运行数据。
3.根据权利要求2所述的集群监测方法,其特征在于,所述监控节点的个数为多个;所述监控节点确定所述集群的可用性之后,还包括:
切换节点获取各个监控节点所确定出的所述集群的可用性;
所述切换节点统计对所述集群的可用性判断一致的监控节点个数;
所述切断节点将所统计到的个数最多的监控节点所确定出的可用性,作为所述切断节点确定出的集群的可用性。
4.根据权利要求3所述的集群监测方法,其特征在于,所述切断节点将所统计到的个数最多的监控节点所确定出的可用性,作为所述切断节点确定出的集群的可用性之后,还包括:
所述切换节点根据所述集群的可用性判断一致的最多监控节点个数与监控节点总个数之比,作为所述切断节点确定出的集群的可用性的置信度。
5.根据权利要求1-4任一项所述的集群监测方法,其特征在于,所述根据所述集群的分区可用率,和/或请求出错率,所述监控节点确定所述集群的可用性,包括:
若所述集群的分区可用率低于预设分区阈值到达预设时长,和/或请求出错率高于请求阈值到达预设时长,所述监控节点确定所述集群为不可用状态。
6.一种切换方法,其特征在于,所述方法包括:
切换节点获取根据权利要求1-5任一项所述的集群监测方法所监测到的第一集群的可用性;
当所述第一集群处于不可用状态时,所述切换节点将所述第一集群切换为第二集群。
7.根据权利要求6所述的切换方法,其特征在于,所述切换节点将第一集群切换为第二集群包括:
所述切换节点在客户端所侦听的目标服务中写入所述第二集群的物理地址;
所述客户端侦听所述目标服务得到所述第二集群的物理地址;
所述客户端根据所侦听到的物理地址访问所述第二集群。
8.一种集群监测方法,其特征在于,包括:
监测集群向客户端提供服务的能力;
根据监测结果,确定集群的可用性。
9.根据权利要求8所述的集群监测方法,其特征在于,所述监测集群向客户端提供服务的能力,包括:
监测集群向客户端提供所需数据的能力;
和/或,监测集群响应客户端请求的能力。
10.根据权利要求9所述的集群监测方法,其特征在于,所述监测集群向客户端提供所需数据的能力包括:
监测所述集群所维护的数据中,处于服务状态的数据所占比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611184874.2/1.html,转载请声明来源钻瓜专利网。