[发明专利]节点故障检测方法及装置有效
申请号: | 201910684978.7 | 申请日: | 2019-07-26 |
公开(公告)号: | CN110474821B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 朱文龙 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;H04L29/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 节点 故障 检测 方法 装置 | ||
本发明提供了一种节点故障检测方法,包括:获取各个节点的IP地址;基于各个所述节点的IP地址,判断每个节点是否满足预先设置的检测条件;将满足所述检测条件的节点确定为目标节点;向各个所述目标节点发送检测指令,并获取各个所述目标节点依据所述检测指令生成的检测信息;判断每个所述检测信息中是否存在异常标识,并将存在异常标识的所述检测信息对应的节点确定为故障节点。应用本发明实施例提供的方法,能够向各个节点发送检测指令,获取各个所述节点依据所述检测指令生成的检测信息,判断该检测信息是否存在异常标识,以确定与该检测信息对应的节点是否存在故障,能快速的发现系统中已经处于故障状态的节点。
技术领域
本发明涉及分布式系统领域,特别涉及一种节点故障检测方法及装置。
背景技术
随着信息科技的发展,分布式系统在互联网领域中占据着举足轻重地位,在分布式系统的分布式管理软件中,通常由多个管理节点组成多个对等的管理集群,其中,管理节点能够管理与其相对应的管理集群中的普通受管节点,在系统运行过程中,各个管理节点及各个普通受管理节点能够互相协作,从而实现整个系统的高可用。
经本发明人研究发现,现有技术中,分布式管理系统的某个管理节点或普通受管节点出现故障时,仍能由系统中的其余相应的节点进行替代工作,使得技术人员难以发现系统中已经处于故障状态节点,不能及时发现问题并解决问题,导致系统实际功能受损。
发明内容
本发明所要解决的技术问题是提供一种节点故障检测方法,能够向各个节点发送检测指令,获取各个所述节点依据所述检测指令生成的检测信息,依据该检测信息判断与其对应的节点是否存在故障,能快速的发现系统中已经处于故障状态的节点。
本发明还提供了一种节点故障检测装置,用以保证上述方法在实际中的实现及应用。
一种节点故障检测方法,包括:
获取各个节点的IP地址;
基于各个所述节点的IP地址,判断每个节点是否满足预先设置的检测条件;
将满足所述检测条件的节点确定为目标节点;
向各个所述目标节点发送检测指令,并获取各个所述目标节点依据所述检测指令生成的检测信息;
判断每个所述检测信息中是否存在异常标识,并将存在异常标识的所述检测信息对应的节点确定为故障节点。
上述的方法,可选的,所述获取各个节点的IP地址,包括:
接收到用户发送的节点检测请求时,解析所述节点检测请求中包含的节点信息;
基于所述节点信息遍历预先设置的IP地址存储表,以获取与所述节点检测请求对应的各个节点的IP地址。
上述的方法,可选的,所述基于各个节点的IP地址,判断每个节点是否满足预先设置的检测条件,包括:
依次对各个所述节点的IP地址进行ping测试,以判断各个所述节点的网络是否连通;
将网络连通的所述节点确定为满足预先设置的检测条件的节点;
将网络不连通的所述节点确定为不满足所述检测条件的节点。
上述的方法,可选的,所述将存在异常标识的所述检测信息对应的节点确定为故障节点之后,还包括:
依据所述异常标识确定所述故障节点的故障类型,遍历预先设置的配置文件,以确定所述故障节点的异常原因;
执行与所述异常原因对应的修复操作,以修复所述故障节点。
上述的方法,可选的,所述目标节点生成检测信息的过程,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910684978.7/2.html,转载请声明来源钻瓜专利网。