[发明专利]一种基于高可用检测节点的分布式系统节点故障检测方法有效
申请号: | 201810219687.6 | 申请日: | 2018-03-16 |
公开(公告)号: | CN108600040B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 高原;张勇;顾文杰;宁剑;陈鹏;王毅;郭骏;张学勇;何源 | 申请(专利权)人: | 国电南瑞科技股份有限公司;国家电网公司华北分部;国家电网公司;南瑞集团有限公司;国电南瑞南京控制系统有限公司 |
主分类号: | H04L43/10 | 分类号: | H04L43/10;H04L41/12;H04L41/0668;H04L41/0677 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;张倩倩 |
地址: | 210003 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可用 检测 节点 分布式 系统 故障 方法 | ||
1.一种基于高可用检测节点的分布式系统节点故障检测方法,其特征在于,包括:
1)在系统中设置两个以上检测节点,其中一个为主检测节点,其余节点为备检测节点,用于对其他所有节点的故障检测;多个检测节点之间使用心跳报文进行主检测节点选举和故障切换,同时心跳报文也会到达系统每个节点,通知每个节点当前具体执行检测工作的主检测节点的IP地址,具体为:每个检测节点周期性的发出UDP广播作为心跳报文,报文中包括检测节点的节点名、IP地址、是否为主节点的信息;非检测节点收到心跳报文 后也会执行检测节 点同样的逻辑,即当主检测节点发生故障后,确定IP地址最小的检测节点为主检测节点,并获知主检测节点的IP地址;当主检测节点发生故障后,备检测节点通过心跳报文重新确定IP地址最小的为主检测节点,完成故障后的主检测点切换;
2)客户端向主检测节点发出请求,由主检测节点对待检测的目标节点进行故障检测;
3)主检测节点将不同客户端对同一个待检测的目标节点的检测请求进行合并;
4)主检测节点接收到请求后开始周期性的对待检测的目标节点进行检测,检测结果缓存在主检测节点的内存中,当其他任意客户端需要对同一目标节点进行检测时,立刻从缓存直接返回目标节点的实时状态。
2.根据权利要求1所述的一种基于高可用检测节点的分布式系统节点故障检测方法,其特征在于,所述主检测节点能够向所有节点广播被检测节点的健康状态。
3.根据权利要求1所述的一种基于高可用检测节点的分布式系统节点故障检测方法,其特征在于,所述步骤2)客户端向主检测节点发出请求,由主检测节点对待检测的目标节点进行故障检测具体为:由某个节点的客户端程序通过TCP或UDP向主检测节点发送请求报文,报文中包括希望被检测的目标节点的IP地址和超时时间这两个参数,由主检测节点向目标节点直接发出ICMP报文,在超时时间内得到响应则回复客户端该目标节点在线,否则回复该目标节点故障。
4.根据权利要求1所述的一种基于高可用检测节点的分布式系统节点故障检测方法,其特征在于,所述步骤3)主检测节点将不同客户端对同一个待检测的目标节点的检测请求进行合并具体为:
主检测节点为每个客户端单独保存了目标IP地址和超时时间参数,实现了对不同目标节点使用不同检测超时时间的功能,主检测节点在超时时间内以均匀间隔连续发出3次ICMP报文进行检测,当收到第一次回复后判定节点状态为在线,当多个客户端对同一目标节点提出检测请求时,对其IP地址和超时时间进 行合并处理,取最短的超时时间,并且只发出一份ICMP检测报文。
5.根据权利要求1所述的一种基于高可用检测节点的分布式系统节点故障检测方法,其特征在于,所述步骤4)主检测节点接收到请求后开始周期性的对目标节点进行检测具体为:当主检测节点第一次收到对某个目标节点的检测请求后就以一定的周期对目标节点发送ICMP报文进行故障检测,此周期可配置,当超过一定的时间间隔没有任何节点再请求检测这个目标节点,则停止周期性ICMP报文的发送,时间间隔可配置。
6.根据权利要求2所述的一种基于高可用检测节点的分布式系统节点故障检测方法,所述主检测节点能够向所有节点广播被检测节点的健康状态具体为:主检测节点不仅仅将检测结果返回给客户端,还能够根据需求将所有被检测节点的健康状态以广播发送到全系统的所有节点,在每个节点上设立检测代理,由代理接收广播后存入本地共享内存,当本地客户端发出请求时,首先查询本地共享内存是否已经存在结果,如果存在则直接获取。
7.根据权利要求1所述的一种基于高可用检测节点的分布式系统节点故障检测方法,主检测节点将已检测过的节点的状态信息存放在本机共享内存,在发送心跳报文的同时也将共享内存的信息通过组播发给其他检测节点。
8.根据权利要求1所述的一种基于高可用检测节点的分布式系统节点故障检测方法,主检测节点对待检测的目标节点进行故障检测时,由待检测的目标节点的系统内核回复检测报文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国电南瑞科技股份有限公司;国家电网公司华北分部;国家电网公司;南瑞集团有限公司;国电南瑞南京控制系统有限公司,未经国电南瑞科技股份有限公司;国家电网公司华北分部;国家电网公司;南瑞集团有限公司;国电南瑞南京控制系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810219687.6/1.html,转载请声明来源钻瓜专利网。