[发明专利]集群监测和切换方法及装置在审
申请号: | 201611184874.2 | 申请日: | 2016-12-20 |
公开(公告)号: | CN108206768A | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 孟庆义 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;H04L29/08 |
代理公司: | 北京市惠诚律师事务所 11353 | 代理人: | 逯博 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集群 分区 监测 服务请求 监控节点 出错率 可用 服务状态 集群可用性 可用性 服务能力 集群服务 监测结果 响应 客户端 客户 统计 成功 | ||
本发明实施例提供了集群监测和切换方法及装置,方法包括:监控节点分别监测集群内各分区的服务状态,和/或集群对客户端的服务请求响应情况,进而监控节点计算处于服务状态的分区数量与分区总数之比,以得到集群的分区可用率,和/或,监控节点统计集群所接收到的客户端服务请求中,未成功进行响应的服务请求,以得到集群的请求出错率,通过对集群服务能力中的分区可用率和请求出错率进行监测之后,根据监测结果,确定集群的可用性。可见,本发明实施例通过分区可用率和/或请求出错率对集群的服务能力进行监测提高了集群可用性监测的准确性。
技术领域
本发明涉及信息技术,尤其涉及一种集群监测和切换方法及装置。
背景技术
为了提高系统的可靠性,分布式系统往往采用主集群和备集群的方式进行架构。当主集群不可用时,切换客户端访问备集群,从而使得客户端能够在应用层面上较稳定地访问分布式系统。例如,图1为现有技术在分布式系统中进行集群监测和切换的示意图,如图1所示,监控节点对集群进行监测,当主集群不可用时,将客户端所访问的主集群切换为备集群。
由于集群不同于单机系统的单节点,集群会包含多个数据节点,因此,在监测集群是否可用时,通过检查各个数据节点的网络是否连通,逐个确定集群中的数据节点是否可访问,当多数数据节点不可访问时,则确定整个集群不可用。
现有技术的集群可用性监测仅使用于系统瘫痪的应用场景下,而在部分数据节点宕机导致分布式系统启用恢复机制的应用场景下,这种可用性监测方法则会出现错误,会将处于可用状态的集群误判为不可用,因此,这种集群可用性监测方法准确性不高。
发明内容
本发明提供一种集群监测和切换方法及装置,用于提高集群可用性监测的准确性。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供了一种集群监测方法,包括:
监控节点分别监测集群内各分区的服务状态,和/或所述集群对客户端的服务请求响应情况;
所述监控节点计算处于服务状态的分区数量与分区总数之比,以得到集群的分区可用率;和/或,所述监控节点统计所述集群所接收到的客户端服务请求中,未成功进行响应的服务请求,以得到集群的请求出错率;
根据所述集群的分区可用率,和/或请求出错率,所述监控节点确定所述集群的可用性。
第二方面,提供了一种换方法,所述方法包括:
切换节点获取根据第一方面所述的集群监测方法所监测到的第一集群的可用性;
当所述第一集群处于不可用状态时,所述切换节点将所述第一集群切换为第二集群。
第三方面,提供了一种集群监测方法,包括:
监测集群向客户端提供服务的能力;
根据监测结果,确定集群的可用性。
第四方面,提供了一种切换方法,包括:
获取根据第三方面所述的集群监测方法所监测到的第一集群的可用性;
当所述第一集群处于不可用状态时,将所述第一集群切换为第二集群。
第五方面,提供了一种集群监测装置,包括:
监测模块,用于监测集群向客户端提供服务的能力;
确定模块,用于根据监测结果,确定集群的可用性。
第六方面,提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行一种数据处理方法,所述方法包括:监测集群向客户端提供服务的能力;根据监测结果,确定集群的可用性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611184874.2/2.html,转载请声明来源钻瓜专利网。