[发明专利]分布式并行图处理中基于P2P的动态容错方法及系统有效

专利信息
申请号: 201510026680.9 申请日: 2015-01-20
公开(公告)号: CN104618153B 公开(公告)日: 2018-08-03
发明(设计)人: 曹东刚;詹杭龙;李宝;梅宏 申请(专利权)人: 北京大学
主分类号: H04L12/24 分类号: H04L12/24;H04L29/08
代理公司: 北京君尚知识产权代理事务所(普通合伙) 11200 代理人: 冯艺东
地址: 100871 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分布式 并行 处理 基于 p2p 动态 容错 方法 系统
【说明书】:

发明涉及一种分布式并行图处理中基于P2P的动态容错方法及系统。该方法包括:定义分布式图处理问题的数据单元,以确保动态容错时所恢复数据的完整性;将处理器节点组成环状结构,将输入的图数据划分成若干分区并将各分区分派到各处理器节点中,每个处理器节点把各自的数据单元生成副本备份在邻接处理器节点中;每个处理器节点执行完自身的数据单元后,以增量的方式更新其放置于相邻处理器节点中的副本;当某个处理器节点失效或因网络出错而离线时,指派其相邻节点利用数据副本替代原先的数据单元,完成相应运算,恢复图处理的正常执行。本发明能够使图处理运算从节点失效、网络出错等异常中恢复正常状态,保证运算的正确执行。

技术领域

本发明涉及计算机网络技术领域,具体涉及一种在开放、动态的网络环境下分布式并行图处理的动态容错的方法及系统。

背景技术

近年来,随着社交网络、协同网络等技术的普及和发展,互联网中的数据规模越来越大,这给分析这些数据带来了新的挑战。在社交网络、协同网络等场景中,数据之间可能存在关联,相关研究经常用图结构来对这些数据进行描述。图中的顶点记录数据自身属性,图中的边对应数据间的关联。这样,对网络数据的分析就转化成了图处理。然而,上述图结构常常具有百万、千万个顶点和数亿条边,这对普通计算机的内存造成很大压力。更严重的是,由于图处理过程将产生正比于图规模的数量的中间结果,这使得单机由于内存的限制难以对图进行正常计算。

因此,利用分布式集群对图进行并行处理便成为了当前网络图数据分析的主要方式。以Google提出的Pregel框架为典型代表,大部分图处理系统将图数据划分成多个子图(或称图分区)分派到若干机器中,对图数据进行并行计算。并行计算主要采用BSP(BulkSynchronous Processing)模型,即对图数据进行迭代运算。在每个迭代步中,图中每个顶点获取邻接顶点的消息,各自更新自身状态,并将新状态传播给邻接顶点。如图1所示,在迭代步之间,所有顶点的运算需要进行同步,当所有顶点完成当前迭代步的运算时,方可触发进入下一迭代步。当所有顶点均求得结果时,图处理计算完成。

在开放的网络环境下,分布式集群具有动态变化的特点,集群中的某些节点可能失效、连接集群的网络可能出错,这些异常情况将影响图处理作业的正常执行。因此,分布式并行图处理需要考虑在运算过程中的容错性。现有的图处理系统一般通过checkpoint机制实现容错。这种容错要求图处理在发现出错时,停止当前运算,重新从磁盘中加载最近一次的checkpoint数据,从该checkpoint所记录的迭代点重新进行运算。这种容错机制是静态的,且恢复代价也比较大,并不适用于开放的网络环境。

发明内容

本发明的目的是提供一种开放、动态网络环境下分布式并行图处理中基于P2P(Peer to Peer,对等计算/对等网络)的动态容错的方法,使得图处理运算能够从节点失效、网络出错等异常中恢复正常状态,保证运算的正确执行。

为实现上述目的,本发明采用如下技术方案:

一种分布式并行图处理中基于P2P的动态容错方法,其步骤包括:

1)定义分布式图处理问题的数据单元,以确保动态容错时所恢复数据的完整性;

2)将处理器节点组成环状结构,将输入的图数据划分成若干分区,并将各分区分派到各处理器节点中,每个处理器节点把各自的数据单元生成副本备份在邻接处理器节点中;

3)在运算的每一个迭代步中,每个处理器节点执行完自身的数据单元后,以增量的方式更新其放置于相邻处理器节点中的副本;

4)当某个处理器节点失效或因网络出错而离线时,指派其相邻节点利用数据副本替代原先的数据单元,完成相应运算,从而恢复图处理的正常执行。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510026680.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top