[发明专利]在分布式数据库中使用递增捕捉来进行逻辑数据备份和回退有效
申请号: | 201110037158.2 | 申请日: | 2011-01-31 |
公开(公告)号: | CN102142024A | 公开(公告)日: | 2011-08-03 |
发明(设计)人: | H·H·胡;吴中伟;O·N·泽利格;S·帕尔;C·罗伯;B·H·M·德尼;L·诺维克;N·R·埃利斯;T·塔留斯 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌;钱静芳 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 数据库 使用 递增 捕捉 进行 逻辑 数据 备份 | ||
技术领域
本发明涉及数据备份和回退技术,更具体地涉及递增的数据备份和回退技术。
背景技术
在大型分布式数据库系统中,可以使用传统SQL(结构化查询语言)备份和还原来进行数据保护。然而,尚有缺点存在。需要完整数据库的备份的盘上副本,这需要与所备份的数据库一样多的存储。另外,需要对事务日志进行周期性备份来用于较低的还原点目标(RPO)。此外,还原时间目标(RTO)很差,因为不管所涉及的数据的大小,任何还原操作都将需要还原整个备份并随后应用一系列事务日志备份文件。该过程非常耗时并是劳动力密集的,并且备份是以不可被直接查询的二进制格式来存储的。
发明内容
下面提供了简化的概述,以便提供对此处所描述的一些新颖实施方式的基本理解。本“发明内容”不是详尽的综述,并且它不旨在标识关键/重要元素或描绘本发明的范围。其唯一的目的是以简化形式提出一些概念,作为稍后提出的更详细描述的序言。
所公开的体系结构是一种消除了对数据的盘上完整备份的需求的有成本竞争力的方法。通过只在单独的表中保留已发生的变更来优化存储。因此,该体系结构允许对关系数据库(例如,SQL)中的递增变更进行递增还原。该体系结构提供经改进的还原时间和还原点目标。通过使用对已变更数据(例如,以XML为格式)的递增捕捉,提供了捕捉模式变更、查询递增地捕捉的数据、并将用户数据高效地还原到更早时间点状态并且没有停机时间的能力。
通过一组触发器来(例如,连续地)跟踪变更(例如,插入、更新以及删除操作),并且根据某一格式(例如,XML)将递增地捕捉的已变更的行插入数据捕捉表中(差分变更“增量”表)。该格式是自描述的并且包含该格式内的行的模式。
数据回退将来自数据捕捉表的适当行的递增变更解压到更早时间点,并随后将这些行覆盖到生产数据。优化插入操作以不在数据捕捉表中创建各行而是在基表中维护变更跟踪信息(例如,插入的协调世界时间(UTC))。
为了为实现上述及相关目的,本文结合下面的描述和附图来描述某些说明性方面。这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。结合附图阅读下面的详细描述,其他优点和新颖特征将变得显而易见。
附图说明
图1示出根据所公开的体系结构的计算机实现的数据管理系统。
图2示出数据管理系统的一替换实施方式。
图3示出数据管理系统的一替换表示。
图4示出一系统,该系统示出为了更新和删除数据操作而对基表进行的修改。
图5示出示例性捕捉和变更跟踪表。
图6示出根据所公开的体系结构的计算机实现的数据管理方法。
图7示出图6的方法的其他方面。
图8示出可用于根据所公开的体系结构来使用镜像之前(before-image)捕捉执行逻辑数据备份和回退的计算系统的框图。
图9示出使用镜像之前捕捉来执行逻辑数据备份和回退的计算环境的示意框图。
具体实施方式
所公开的体系结构提供高效地捕捉数据操作的“镜像之前”(递增)数据变更以及变更跟踪信息并随后使用这些变更和信息来高效地回退更新/删除/插入操作的能力。镜像之前数据是对其进行了变更,但在该已变更数据被处理来覆盖生产数据之前的数据。递增数据的存储空间是用于整个备份和事务日志备份的空间的一小部分。此外,从数据捕捉表回退更新/删除/插入操作的时间相对于从整个备份和事务日志备份进行还原的时间而言是很小的。
如本文所使用的,表是采用控制跨服务器的划分的划分键并且还采用控制在一服务器内各行的排序的群集键的逻辑关系。表群是具有同一划分键的表的集合。行群是具有同一划分键值的表群中的行的集合。行群完全处于一个服务器上,但可以不被群集在一起。每一表群可以跨节点分布。每一存储节点是被分配了一定范围(分区)的键值,并且出于耐久性目的而复制了每一分区。
镜像之前数据可以用包含这些行的自描述模式的XML(可扩展标记语言)格式来持久存储。因此,该解决方案对模式评估是有效的。另外,镜像之前数据可以被持久存储在同一分区中(例如,表群),并且因而是高度可用的。此外,自动地管理并维护镜像之前保留策略,并且该镜像之前数据可以经由诸如TSQL(事务结构化查询语言(SQL))等传统关系语言来查询。
选择镜像之前优于镜像之后,使得变更可以从该分区内的当前数据向后应用(撤消而非重做),并且因此消除了对完整分区备份的需求以节省存储空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110037158.2/2.html,转载请声明来源钻瓜专利网。