[发明专利]一种业务进程故障处理方法、通知方法和装置有效
申请号: | 201810820353.4 | 申请日: | 2018-07-24 |
公开(公告)号: | CN110752939B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 范超;陈雷 | 申请(专利权)人: | 成都华为技术有限公司 |
主分类号: | H04L41/046 | 分类号: | H04L41/046;H04L41/06;H04L41/0246 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 进程 故障 处理 方法 通知 装置 | ||
本申请实施例提供一种业务进程故障处理方法、通知方法和装置,涉及通信技术领域,用以缩短检测集群系统中业务进程故障的时间,该方案包括:进程退出处理部件接收第一触发消息,所述第一触发消息包括第一业务进程的信息;所述第一业务进程为运行在从服务器上的一个或者多个业务进程中的任一个;进程退出处理部件根据所述第一触发消息,确定所述第一业务进程故障;进程退出处理部件在第一地址列表中写入第一业务进程的信息后,向业务进程监控部件发送第二触发消息,所述第二触发消息用于指示第一业务进程故障,所述业务进程监控部件用于将所述第一业务进程的信息发送给主服务器,所述主服务器用于向至少一个从服务器发送进程视图。
技术领域
本申请实施例涉及通信技术领域,尤其涉及一种业务进程故障处理方法、通知方法和装置。
背景技术
集群系统通常采用冗余的可脱离的部件和专门的软件,可以在集群系统出现单点故障的情况下降级运行,大大提高了集群系统的可用性。集群系统通常采用心跳机制作为检测集群系统中节点(例如,计算机)的工作状态。当节点的工作状态变化时,以通知集群管理工具进行故障倒换。其中,集群管理工具可以使集群系统包括的多个节点执行的工作量达到最大、平衡工作负载以减少瓶颈、监视每个节点的运行状况并在节点出现故障时管理故障转移。
图1示出了分布式系统的可靠协调系统(zookeeper),zookeeper的客户端(client)和服务端(server)之间采用心跳机制进行保活。如果client在2/3超时(Timeout)未收到与其连接的一个server的响应(Acknowledgement,ack),client确定与其连接的server故障。server在1个Timeout时间周期未收到与其连接的client发的心跳包,server确定与其连接的client故障。
图2示出了分布式存储软件(Dsware)集群进程的故障检测示意图,Dsware将集群管理服务器(Culster Manager Server,CMS)本地硬盘组织成一个虚拟存储资源池,为集群管理客户端(Cluster Manager Client,CMC)提供块存储功能。在图2中,每个CMC包括的一个或者多个业务进程定时发送心跳到CMS,CMS为每个业务进程提供租约,如果CMS超过租约期未收到业务进程的心跳,认为该业务进程故障。
虽然图1中的Timeout和图2中的租约可以由用户设置,例如,Timeout通常设置为3.5秒,租约通常设置为5秒。但是,在client故障的情况下,图1中server需要历时3.5秒才能检查出故障,图2中CMS需要5秒才能检测出故障,检测时间长。由于集群系统中各个节点通信时通常存在系统时延,若将Timeout设置小于3.5秒或者将租约设置小于5秒,则有可能存在误判的情况。例如,某个client并未故障,但是由于系统时延的存在,server在Timeout时间周期内未收到与其连接的client发的心跳包,server确定与其连接的client故障。
发明内容
本申请实施例提供一种检测业务进程故障的方法和装置,用以缩短检测集群系统中业务进程故障的时间。
为了解决上述技术问题,本申请实施例采用如下技术方案:
第一方面,本申请实施例提供一种业务进程故障处理方法,包括:进程退出处理部件接收第一触发消息,所述第一触发消息包括第一业务进程的信息;所述第一业务进程为运行在从服务器上的一个或者多个业务进程中的任一个;进程退出处理部件根据所述第一触发消息,确定所述第一业务进程故障;进程退出处理部件在第一地址列表中写入第一业务进程的信息后,向业务进程监控部件发送第二触发消息,所述第二触发消息用于指示第一业务进程故障,所述业务进程监控部件用于将所述第一业务进程的信息发送给主服务器,所述主服务器用于向至少一个从服务器发送进程视图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都华为技术有限公司,未经成都华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810820353.4/2.html,转载请声明来源钻瓜专利网。