[发明专利]基于本地策略管理节点网络故障的程序在审
申请号: | 201910549638.3 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110635937A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 古伊劳姆·莱保泰雷;伊曼纽尔·布雷莱;弗洛伦特·杰曼;皮奥特尔·莱斯尼基 | 申请(专利权)人: | 布尔有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08 |
代理公司: | 11315 北京国昊天诚知识产权代理有限公司 | 代理人: | 南霆;李有财 |
地址: | 法国莱*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储介质 节点发生故障 重定向 备份 链路 存储介质连接 操作节点 故障管理 节点网络 节点状态 检索 保存 返回 网络 | ||
本发明涉及节点网络中的故障管理方法,包括:首先,将所考虑节点的状态本地保存到该所讨论节点的存储介质的步骤,该存储介质与该所考虑节点之间的链路可以从该存储介质重定向到另一个节点。然后,如果所考虑节点已经故障,则通过重定向所考虑节点与其存储介质之间的链路来检索所考虑节点状态的本地备份的步骤,以便将该存储介质连接到与所考虑节点不同的操作节点,然后,如果至少一个所考虑节点发生故障,则将该所考虑节点的该本地备份返回到在该节点发生故障时添加到网络的新的附加节点的步骤。
技术领域
本发明涉及用于管理节点网络中的故障的方法以及与该故障管理相关联的节点网络部分。
背景技术
在执行相同计算的节点网络中,备份在一个或多个级被执行。因此,这些是多级备份。当发生故障时,可以至少部分地恢复计算而无需完全重启,这简单来说归功于备份。根据故障类型,使用一定级的备份来部分或甚至以大多数或几乎完全的方式恢复计算。
分布式应用程序可以持续比平均值更长的时间,没有任何网络故障,也称为群集的MTBF(“平均故障间隔时间”),因此它们有很多中断机会。通常,它们没有内部故障管理解决方案,这可能导致在计算节点发生物理故障时丢失本地备份数据。然后,由于单个计算节点丢失但无法再恢复其本地备份数据而导致所有计算步骤丢失。
备份中存在称为“检查点/重启”解决方案的备份和检索解决方案,允许应用程序根据不同的速度定期将其上下文保存在不同级的备份上。
不同的备份级从非常本地到非常全局,从最简单,最快速到最复杂,从最慢,最昂贵,最不强大,最弱到最强大,最灵活的备份。
根据FTI库(“容错接口”),先前的方法指出有四种已知的备份级,它们是:
第一级L1,执行本地备份。这很简单,成本低廉并且经常执行,导致故障期间计算时间的最小损失以及具有在第一级L1的检索能力,
第二级L2,通过在伙伴节点上复制执行第一次中间备份,其不那么简单且稍贵,导致在故障期间更大的计算时间损失,只能在第二级L2检索,
第三级L3,它使第二中间保存所罗门(Reed-Solomon)编码,更简单,但仍然稍微昂贵,导致在故障期间更大的计算时间损失,并且仅在第三级L3可恢复,
第四级L4,在文件系统方面执行全局备份,其是复杂且非常昂贵的,导致在故障期间真正重大的计算时间损失,只能在第四级L4检索。
从本地级L1到全局级L4,备份变得越来越强大和灵活,但它也变得越来越复杂和昂贵。出于这个原因,经常执行第一级备份L1,次经常执行第二级备份L2,更少执行第三级备份L3,执行第四级备份L4相对罕见。因此,从统计上来说,当发生故障时,可以恢复的最后一个相干状态在第一级L1是最近的,在第二级L2次近,在第三级L3稍远,甚至在第四级L4更远。因此,损失的工作量在第一级L1非常小,在第二级L2相对受限,在第三级L3处显着,在第四级L4处更大。
发明内容
本发明的目的是通过至少部分地克服上述缺点,提供一种节点网络中的故障管理方法。
更具体地,本发明旨在通过改进一方面效率与另一方面成本和复杂性之间的折衷来提供节点网络中的故障管理手段,用于所考虑的至少一个备份级。
更具体地,本发明的目的是提供一种节点网络中的故障管理方法,其效率与中间级备份的效率相似或相当,优选地与第一中间备份,第二级L2在成本和复杂性方面更有利,其与本地级备份的成本和复杂性相似或相当,优选地在第一级L1内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于布尔有限公司,未经布尔有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910549638.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于全局策略管理节点网络故障的程序
- 下一篇:一种监控方法、系统、设备及介质