[发明专利]一种数据备份方法及流计算系统有效

专利信息
申请号: 201710482647.6 申请日: 2014-07-04
公开(公告)号: CN107451012B 公开(公告)日: 2020-09-25
发明(设计)人: 夏命榛;史云龙 申请(专利权)人: 华为技术有限公司
主分类号: G06F11/14 分类号: G06F11/14
代理公司: 暂无信息 代理人: 暂无信息
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 备份 方法 计算 系统
【说明书】:

发明提供一种数据备份方法及流计算系统,该方法包括:目的PE从自身的接收队列中读取第一检查点元组,若判断所述第一检查点元组的批号与当前批号相同,且与所述第一检查点元组具有相同批号的所有元组都已处理完毕,则将自身的状态数据备份至所述流计算系统的分布式存储器中。本发明提供的数据备份方法和流计算系统,采用异步备份的方式,使得数据备份不受PE之间数据传递时延的影响,同时通过设置元组的批次,通过批号的比较,使得同一批号的所有元组到齐之后再进行状态备份,保证了数据备份的一致性。

技术领域

本发明涉及计算机技术领域,尤其涉及一种数据备份方法以及一种流计算系统。

背景技术

近年来,数据密集型业务已经得到越来越广泛的应用,这些业务的实例包括金融服务、网络监控、电信数据管理、传感检测等等。数据密集型业务产生的数据具有数据量大、快速、时变的特点,流计算系统在接收流数据时就开始对其进行处理,以保证实时性。如图1所示,流计算系统通常包括一个主控节点(Master)和多个工作节点(worker),主控节点主要负责调度和管理各个工作节点,而工作节点是承载实际的数据处理操作的逻辑实体,工作节点具体通过调用若干个执行单元(PE,Process Element)来对数据进行处理,PE是业务逻辑的物理执行单元。

可以看出,流计算系统实质上是一个分布式集群系统,因此系统出现异常的概率较高,流计算系统发生故障可能会导致业务中断或状态数据丢失,为了保证流计算系统的可靠性,现有技术通常采用多节点备份机制,如图2所示,周期性的将每个工作节点中的PE的状态数据以及业务数据备份至其他工作节点的内存,当某个工作节点出现故障,则迁移到备份的工作节点继续进行数据处理。

由于流计算系统是分布式数据处理系统,工作节点中的每个PE可能会处理多条数据流中的数据,同时,同一数据可能会同时被不同的PE处理,流计算系统中数据处理的并发性和无序性,以及PE之间数据传递的时延,会导致采用现有技术这种整体同步备份的方式,数据备份的一致性得不到保证。

发明内容

本发明实施例提供一种数据备份方法及流计算系统,用以保证分布式流计算系统中数据备份的一致性。

第一方面,本发明实施例提供了一种数据备份方法,应用于流计算系统中,所述流计算系统包括多个工作节点,所述多个工作节点通过调用多个执行单元PE来对待处理的元组进行处理,所述多个执行单元包括:源PE和目的PE;所述源PE将自身的发送队列中缓存的元组发送到所述目的PE的接收队列中,所述目的PE读取自身的接收队列中的元组并进行处理;所述源PE的发送队列中缓存的元组包括普通元组和检查点元组,且每个元组携带有用于表示该元组批次的批号;其中,检查点元组用于指示PE进行数据备份或数据恢复;所述源PE的发送队列中不同的检查点元组具有不同的批号,处于相邻的两个检查点元组之间的普通元组具有相同的批号,且每个检查点元组的批号与其相邻的一个普通元组的批号相同;所述数据备份方法包括:

所述目的PE从自身的接收队列中读取第一检查点元组,所述第一检查点元组用于指示所述目的PE进行状态数据备份;

所述目的PE判断所述第一检查点元组的批号与当前批号是否相同,以及与所述第一检查点元组具有相同批号的所有普通元组是否都已处理完毕;所述当前批号为所述目的PE当前处理的普通元组的批号;

若所述第一检查点元组的批号与所述当前批号相同,且与所述第一检查点元组具有相同批号的所有普通元组都已处理完毕,则所述目的PE将自身的状态数据进行备份;其中,所述目的PE的状态数据包括所述目的PE在处理所述普通元组过程中产生的数据。

在第一方面的第一种可能的实现方式中,所述数据备份方法还包括:

所述目的PE从自身的接收队列中读取第二检查点元组,所述第二检查点元组用于指示所述目的PE进行状态数据恢复;

所述目的PE加载自身备份的状态数据,并基于所述备份的状态数据进行状态恢复和数据回放。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710482647.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top