[发明专利]一种基于高可用检测节点的分布式系统节点故障检测方法有效
申请号: | 201810219687.6 | 申请日: | 2018-03-16 |
公开(公告)号: | CN108600040B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 高原;张勇;顾文杰;宁剑;陈鹏;王毅;郭骏;张学勇;何源 | 申请(专利权)人: | 国电南瑞科技股份有限公司;国家电网公司华北分部;国家电网公司;南瑞集团有限公司;国电南瑞南京控制系统有限公司 |
主分类号: | H04L43/10 | 分类号: | H04L43/10;H04L41/12;H04L41/0668;H04L41/0677 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;张倩倩 |
地址: | 210003 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可用 检测 节点 分布式 系统 故障 方法 | ||
本发明公开了一种基于高可用检测节点的分布式系统节点故障检测方法,包括1)在系统中设置两个以上检测节点,用于对其他所有节点的故障检测;多个检测节点之间使用心跳报文进行主检测节点选举和故障切换,同时心跳报文也会到达系统每个节点;2)客户端向主检测节点发出请求,由主检测检点对待检测的节点进行故障检测;3)主检测节点将不同客户端对同一个待检测的目标节点的检测请求进行合并;4)主检测节点接收到请求后开始周期性的对目标节点进行检测,检测结果缓存在主检测节点的内存中,能够合并检测相同的目标节点,本发明能够避免用户层程序卡顿对检测结果的误判,并且减少了报文数量,提高了检测效率。
技术领域
本发明涉及一种基于高可用检测节点的分布式系统节点故障检测方法,属于网络通信技术领域。
背景技术
分布式系统是由多个节点构成,如果某些节点发生故障后不进行处理,如流量分摊、主备切换等处理动作,则会影响整个系统的功能。因此如何快速准确的判断节点故障是非常重要的。
心跳方案是目前较为流行的节点故障检测方法,但是它有一项重大缺陷,就是心跳发送和接收程序是运行在操作系统之上的用户层级中,一旦CPU等资源不足,心跳程序会发生卡顿,会造成误判。
另外操作系统的ping命令是一种常用的节点检测手段,但是如果简单的让每个节点ping其他所有节点获取状态,则系统形成一个网状的检测拓扑结构,报文数量与节点数量成指数级相关,大量的ping报文可能会造成网络瘫痪。
发明内容
针对现有技术存在的问题,本发明提供一种基于高可用检测节点的分布式系统节点故障检测方法,能够避免用户层程序卡顿对检测结果的误判,并且减少了报文数量,提高了检测效率。
本发明所要解决的技术问题是通过以下技术方案实现的:
本发明是一种基于高可用检测节点的分布式系统节点故障检测方法,方法采用具备多个冗余备份的检测节点对目标节点发送ICMP(Internet Control Message Protocol,控制报文协议)报文进行故障检测,能够将多个客户端对同一个节点的检测请求进行合并,能够利用检测节点本地缓存和全局共享内存对检测请求应答进行加速。
一种基于高可用检测节点的分布式系统节点故障检测方法,包括:
1)在系统中设置两个以上检测节点(检测节点可以由任意节点担任)其中一个为主检测节点,其余节点为备检测节点,用于对其他所有节点的故障检测;多个检测节点之间周期性的发出UDP广播作为心跳报文,报文中包括检测节点的节点名、IP地址、是否主节点等信息。每个检测节点在收到其他检测节点的心跳后,选举出IP地址数值最小的节点为主检测节点。非检测节点收到心跳后也会执行同样的逻辑确定主检测节点,并获知主检测节点的IP地址用于通信。当主检测节点故障后,其他检测节点通过心跳报文重新确定IP地址最小的为主检测节点,完成故障切换。同时主检测节点周期性的将检测结果通过组播发送到其他检测节点,使得故障切换后新的主检测节点能够获取上一时刻系统节点的状态,能够立刻响应客户端的查询请求,实现无缝切换。
2)客户端(即每个节点的客户端程序)调用接口,接口内通过TCP或UDP向主检测节点发送请求报文,报文中包括希望被检测的目标节点的IP和超时时间这两个参数。由主检测节点向目标节点直接发出ICMP报文,在超时时间内得到响应则回复客户端该目标节点在线,否则回复该目标节点故障,并且主检测检点对待检测的节点进行故障检测时,由被检测点的系统内核回复检测报文,这样避免了用户层程序卡顿对判断造成影响,并且检测网络的拓扑是以检测节点为中心的星型结构,代替了传统的每个节点对等的网状结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国电南瑞科技股份有限公司;国家电网公司华北分部;国家电网公司;南瑞集团有限公司;国电南瑞南京控制系统有限公司,未经国电南瑞科技股份有限公司;国家电网公司华北分部;国家电网公司;南瑞集团有限公司;国电南瑞南京控制系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810219687.6/2.html,转载请声明来源钻瓜专利网。