[发明专利]用于在服务器故障的事件中能使客户端应用更快恢复的方法有效
申请号: | 200980120431.9 | 申请日: | 2009-03-10 |
公开(公告)号: | CN102047643A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 迈克尔·科菲;曼朱纳思·B·穆图尔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | H04L29/14 | 分类号: | H04L29/14;H04L29/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 服务器 故障 事件 中能使 客户端 应用 恢复 方法 | ||
技术领域
本发明一般地涉及多节点数据处理系统和方法。更具体地,本发明涉及用于在服务器故障事件中改善恢复时间的系统和方法。更加具体地,本发明涉及这样的系统:与等待基于故障节点的性能的缺失来确定故障不同,故障转移(fallover)节点提供故障通知。如此处以及所附权利要求中所使用的,所述术语“节点”和“服务器”可互换使用,不过,可以理解,服务器可以包括若干节点。
背景技术
在诸如HACMP(高可用性集群管理程序)的集群件(clusterware)应用中,存在很多客户端应用,当主服务器发生故障时,它们足够智能地自动重新连接到备用服务器。可以通过将正在与客户端交互的主服务器的IP(因特网协议)地址动态地移动到备用服务器实现这一点。因此,客户端应用不必响应于服务器故障而被终止和/或重启。集群件的此能力在这里被称为“故障转移”。然而,问题是,一旦主服务器发生故障,所述客户端和服务器之间存在的TCP(传输控制协议)连接需要一段时间来被终止。这主要是因为客户端应用不知道服务器的故障,所以所述客户端应用持续重传,直到所述TCP重传计数器过期(expire),由此最终终止所述TCP连接。因此,可以看出客户端应用在尝试与备用服务器重新连接之前,花费相当长的时间才意识到所述服务器故障。因此,由上可知,本领域存在克服这里和上面所述的低效和局限的需求。
发明内容
上面描述的延迟可以通过及时地向客户端通知故障事件来避免。所述客户端一旦接收到这个关于服务器故障的通知,则优选地重新连接。本发明优选地提供了用于加速客户端应用与集群内的一个或多个备用服务器重新连接的过程的机制。为了快速终止所述服务器(假定发生故障的节点)与所述客户端之间存在的所有TCP连接,一旦所述服务器发生故障,则所述客户端优选地接收用于该TCP连接的RST(重置分组)。虽然预计此RST分组所来自的节点发生故障,但本发明的方法仍然优选地生成此RST分组。为了达到此目的,一旦故障转移发生,则所述故障转移节点(备用服务器)优选地向所述客户端发送此RST分组。效果上,对于客户端,所述故障转移节点装作故障节点。
按照本发明的一个实施例,一种用于改善故障转移条件下的恢复的方法包括下述步骤:向客户端应用发送服务器节点的故障的通知,所述服务器节点正担任用于在客户端节点上运行的客户端应用的服务器。由担任所述服务器节点的备用的故障转移节点提供此通知。
优选地,所述故障转移节点伪装成所述服务器节点,以发送所述故障的通知。根据优选的实施例,从所述客户端应用接收数据分组。该分组被访问来确定传送信息,且所述传送信息被用于向所述客户端应用发送所述服务器节点的故障的通知。
根据优选的实施例,所述数据分组是当所述客户端应用没有接收到向所述服务器节点的数据分组的原始传送的应答时、已经被所述客户端应用重传的数据分组。在一个实施例中,所述故障转移节点通知所述客户端节点:所述故障转移节点已经替换所述服务器节点。
额外的特征和优势可以通过本发明的技术实现。本发明的其他实施例和方面在此详细说明,并作为要求权利的本发明的一部分。
本发明的各种实施例满足的期望目标在此的详述并不是为了暗示或表明任何或所有所述目标单独地或共同地是本发明最一般的实施例或任何更具体的实施例中的必要特征。
附图说明
下面将参考以下附图并仅以示例的方式说明本发明的优选实施例。
图1是说明使用本发明的基本节点配置环境之间的连接的框图,并且还说明了在本发明的优选实施例的操作中发生的事件的序列;以及
图2是说明本发明的优选实施例的处理中典型地出现的事件的序列的流程图。
具体实施方式
如之前所讨论的,客户端可以利用诸如TCP协议等与服务器通信。如果所述服务器发生故障,所述客户端可能不会注意到故障已经发生。在不存在对客户端发送出的分组的任何应答的情况下,所述客户端将持续重传直到所述TCP重传计数器过期。这可能是相当一段时间之后。因此,期望强行终止并重置所述客户端与服务器之间的连接。所述TCP协议具有重置(RST)选项。当双方正在通信时,如果第一方注意到另一方已经停止了通信,则所述第一方可以发送RST以强制另一方重置所述连接。然而,这里的关键是所述客户端可能在相当一段时间内不会意识到存在问题。当所述客户端最终意识到存在问题时,所述客户端将接着尝试重新连接,并将连接到故障转移节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980120431.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:甲壳素自动连续投料装置
- 下一篇:转台码垛机控制系统