[发明专利]基于分布式图处理网络的容错方法和设备在审
申请号: | 202011616126.3 | 申请日: | 2016-08-30 |
公开(公告)号: | CN112698978A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 科瓦尔·沃拉;田琛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;H04L12/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分布式 处理 网络 容错 方法 设备 | ||
1.一种控制器,其特征在于,包括:
存储器;
处理器,其耦合到所述存储器并用于:
控制第一设备、第二设备和第三设备,所述第一设备、第二设备和第三设备为所述分布式图处理系统中的设备,所述分布式图处理系统用于处理相对应的分布式图;
确定所述第二设备故障以及所述第三设备故障;
指示发起在所述第一设备、所述第二设备以及所述第三设备之间的最小恢复。
2.根据权利要求1所述控制器,其特征在于,所述处理器具体用于当所述控制器在第二预期时间没有接收到来自所述第二设备的第二心跳信息时,确定所述第二设备故障。
3.根据权利要求1所述控制器,其特征在于,所述处理器具体用于当所述控制器在第三预期时间没有接收到来自所述第三设备的第三心跳信息时,确定所述第三设备故障。
4.根据权利要求1所述控制器,其特征在于,所述处理器用于指示发起所述最小恢复时具体用于,指示所述第二设备回滚至第二设备最近的快照,指示所述第三设备回滚至第三设备最近的快照,且不指示所述第一设备进行回滚。
5.根据权利要求1所述控制器,其特征在于,所述处理器还用于:
确定最近完成的检查点;
确定在所述最近完成的检查点过程中所述第二设备的第二快照的第二时间;
确定在所述最近完成的检查点过程中所述第三设备的第三快照的第三时间;
当所述第二时间在所述第三时间之前,将所述第二快照的顺序排在所述第三快照之前;
指示所述第一设备根据来自第二快照的第二设备的第二输入,处理与所述第二设备相关联且是所述分布式图的一部分的第二子图,直至第二收敛,
指示所述第一设备在第二收敛之后,根据来自第三快照的第三设备的第三输入,处理与所述第三设备相关联且是所述分布式图的一部分的第三子图,直至第三收敛。
6.一种在控制器中实现的方法,其特征在于,所述方法包括:
控制第一设备、第二设备和第三设备,所述第一设备、第二设备和第三设备为所述分布式图处理系统中的设备,所述分布式图处理系统用于处理相对应的分布式图;
确定所述第二设备故障以及所述第三设备故障;
指示发起在所述第一设备、所述第二设备以及所述第三设备之间的最小恢复。
7.根据权利要求6所述方法,其特征在于,所述所述第二设备故障时具体包括,根据在第二预期时间没有接收到来自所述第二设备的第二心跳信息,确定所述第二设备故障。
8.根据权利要求6所述方法,其特征在于,所述所述第三设备故障时具体包括,根据在第三预期时间没有接收到来自所述第三设备的第三心跳信息,确定所述第三设备故障。
9.根据权利要求6所述方法,其特征在于,所述指示发起所述最小恢复具体包括,指示所述第二设备回滚至第二设备最近的快照,指示所述第三设备回滚至第三设备最近的快照,且不指示所述第一设备进行回滚。
10.根据权利要求6所述方法,其特征在于,所述方法还包括:
确定最近完成的检查点;
确定在所述最近完成的检查点过程中所述第二设备的第二快照的第二时间;
确定在所述最近完成的检查点过程中所述第三设备的第三快照的第三时间;
当所述第二时间在所述第三时间之前,将所述第二快照的顺序排在所述第三快照之前;
指示所述第一设备根据来自第二快照的第二设备的第二输入,处理与所述第二设备相关联且是所述分布式图的一部分的第二子图,直至第二收敛,
指示所述第一设备在第二收敛之后,根据来自第三快照的第三设备的第三输入,处理与所述第三设备相关联且是所述分布式图的一部分的第三子图,直至第三收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011616126.3/1.html,转载请声明来源钻瓜专利网。