[发明专利]集群故障检测方法和装置在审
申请号: | 201910953290.4 | 申请日: | 2019-10-09 |
公开(公告)号: | CN110716842A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 刘志杰 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 11453 北京名华博信知识产权代理有限公司 | 代理人: | 姜超 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 巡检 异常节点 集群 服务状态信息 服务集群 服务 检测 计算机互联网 大规模集群 方法和装置 上游服务器 场景 故障检测 集群服务 集群规模 人工巡检 网络环境 依赖关系 上游 多集群 复杂度 代理 部署 | ||
1.一种集群故障检测方法,其特征在于,包括:
在集群内节点中检测服务异常的服务异常节点;
当检测到所述服务异常节点时,获取与所述服务异常节点所属集群存在第一依赖关系的至少一个上游服务集群;
检测各个所述上游服务集群的服务状态信息,所述服务状态信息指示所述上游服务器集群服务正常或服务异常。
2.根据权利要求1所述的方法,其特征在于,所述在集群内节点中检测服务异常的服务异常节点,包括:
获取集群索引,所述集群索引指示所述集群内部拓扑结构,所述集群内部拓扑结构包括:集群内的全部节点和各节点间的连接关系;
通过监测系统获取所述集群内各个节点的工作状态信息,所述监测系统至少包括以下平台中的任一或任意多个:
集群主节点、分布式布置与监控系统、机器报障系统、机器状态检测设备、分布式版本控制系统、关键指标监控系统,
其中,所述集群主节点提供其所属集群内各节点的服务状态信息,所述机器报障系统提供节点的报修信息,所述机器状态检测设备提供节点的连通性信息和/或硬件性能信息,所述分布式版本控制系统提供节点的服役情况信息,所述关键指标监控系统提供节点级和集群级的关键指标;
根据所述工作状态信息,确定所述服务异常节点。
3.根据权利要求2所述的方法,其特征在于,所述根据所述工作状态信息,确定所述服务异常节点,包括以下至少一项:
根据所述集群内各节点的服务状态信息,将服务状态异常的节点确定为所述服务异常节点;
根据所述集群内各节点的服役情况信息,将退役节点确定为所述服务异常节点;
根据所述集群内各节点的报修信息,将处于报修中的节点确定为所述服务异常节点;
根据所述集群内的各节点的连通性信息,将发生连通异常的节点确定为所述服务异常节点;
根据所述集群内的各节点的硬件性能信息,将发生硬件异常的节点确定为所述服务异常节点。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
获取各集群所述提供的服务之间的第二依赖关系,所述第二依赖关系包括以下至少一项:下游服务调用上游服务、所述下游服务以所述上游服务的输出作为输入;
将提供所述下游服务的集群确定为下游服务集群,将提供所述上游服务的集群确定为上游服务集群;
基于所述下游服务集群和所述上游服务集群所提供的服务之间的第二依赖关系,确定所述下游服务集群和所述上游服务集群之间的第一依赖关系。
5.根据权利要求4所述的方法,其特征在于,所述获取与所述服务异常节点所属集群存在第一依赖关系的至少一个上游服务集群,包括:
获取所述第一依赖关系;
根据所述第一依赖关系确定所述服务异常节点所属集群作为下游服务集群时对应的至少一个上游服务集群。
6.根据权利要求5所述的方法,其特征在于,所述服务状态信息包含集群级关键指标的检测结果,所述检测各个所述上游服务集群的服务状态信息,包括:
获取各个所述上游服务集群的预置的集群级关键指标的检测结果;
根据所述集群级关键指标的检测结果,确定各个所述上游服务集群服务正常或服务异常。
7.根据权利要求6所述的方法,其特征在于,该方法还包括:
在存在至少一个服务异常的上游服务集群的情况下,确定所述上游服务集群的服务异常构成了所述服务异常节点发生服务异常的原因。
8.根据权利要求4所述的集群故障检测方法,其特征在于,该方法还包括:
获取存在第一依赖关系的多个集群的集群级关键指标的检测结果;
根据所述检测结果,发现存在服务异常的上游服务集群;
将所述上游服务集群服务异常的信息发送给所述上游服务集群的下游服务集群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910953290.4/1.html,转载请声明来源钻瓜专利网。