[发明专利]经重复消除的数据的备份有效

专利信息
申请号: 201080006849.X 申请日: 2010-01-19
公开(公告)号: CN102308288A 公开(公告)日: 2012-01-04
发明(设计)人: G·T·基施 申请(专利权)人: 国际商业机器公司
主分类号: G06F11/14 分类号: G06F11/14
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 重复 消除 数据 备份
【说明书】:

技术领域

发明涉及数据重复消除,并且更特别地,涉及向数据存储介质备份经重复消除的数据。

背景技术

计算机系统采用通常部分地采用不时更新数据的应用。该数据继而通常被存储,可能首先是被存储到诸如存储器或者盘的存储库,随后被存储到诸如可拆卸介质的数据存储介质,其示例包括磁带、光盘、盒式磁盘、盒式存储器,等等。如本领域中已知的,向储存库和向数据存储介质的存储可以被称为数据的备份,并且由备份/恢复应用来进行。例如,一个用户或者一组用户可能希望向储存库备份定期(例如,每天或者每周)备份特定应用的数据或者在其计算机上存储的所有数据,以作为针对重要数据可能的崩溃、损坏或者意外删除的预防措施。

对数据流的部分更新可能源自各更新应用中的每个应用仅使用该数据流的一部分。在一个示例中,一个应用或者用户将使用和更新包括数据流一部分的一个或者多个数据集或者虚拟卷,而另一应用或者用户将使用和更新包括数据流的另一部分的一个或者多个数据集或者虚拟卷。在任一情况下,常常只有所备份的数据流中的数据集或者虚拟卷的小部分已被更新,因此当前数据的大部分可能已经存在于储存库中,只有少量改变。

用于减少储存库中所存储的相同数据的量的过程被称为数据重复消除,并且各种技术是本领域技术人员所已知的。数据重复消除最终结果是:对于相同的数据部分,该数据部分的一个拷贝被存储为第一拷贝,而将其他拷贝替换为指向第一拷贝的指针。

在此,用于数据给定部分的每个第一拷贝和指向第一拷贝的任何指针中的每一个被称为针对该数据的重复消除的“引用”。数据的没有相同拷贝的唯一的部分也被称为针对该数据的重复消除的“引用”。

由此,经重复消除的虚拟卷可以包括唯一的数据块与或者是第一拷贝或者是指向第一拷贝的指针的数据块的组合。依赖于用来创建重复消除的技术,数据块可以具有一致的或者可变的尺寸。

如本领域技术人员所知,经重复消除的数据通常始于以重复消除形式向储存库“备份”,并且通常被存储在诸如RAID之类的硬盘驱动系统上。RAID系统使用奇偶校验系统来确保数据不被丢失,即使数据的大部分可能变得被损坏等。数据可以被格式化以模仿磁带或者其他形式的可拆卸介质,但是按照可以快速恢复原始数据的方式被布置在硬盘驱动系统上。包括虚拟卷的数据流可以作为完整原始数据流而存在,并且在其被备份到储存库时被重复消除;或者它可以被重复消除并且以经重复消除形式被存储在例如临时存储中,并且继而被备份到储存库。

备份储存库本身必须不时地备份以便避免过高的成本,并且备份通常是向实际的可拆卸介质(例如磁带库)。为了恢复原始数据通常需要访问数据,并且一个库维护可拆卸介质以供快速访问,尽管它比盘驱动系统的访问更慢。当向物理带传送数据时,可以对数据进行重建以用于传送,在这种情况下其扩展和消耗大量的带,例如,扩展因子可以是10或者20。

发明内容

方法和和系统备份经重复消除的数据,该经重复消除的数据包括针对重复消除而被引用的多个数据块。

在一个实施方式中,一个步骤包括确定存在对每个数据块的多次引用;并且一个步骤包括存储具有对其的多次引用的至少每个数据块的至少两个拷贝,其中向独立的数据存储介质存储数据块的每个拷贝。

在另一实施方式中,一个步骤包括确定对每个数据块的引用;一个步骤包括比较该引用与引用阈值;一个步骤包括在引用阈值未被超过的情况下存储每个数据块的单个拷贝;以及一个步骤包括在引用阈值被超过的情况下存储每个数据块的多个拷贝。

在又一实施方式中,多个拷贝存储步骤包括向独立数据存储介质的每一个存储数据块的多个拷贝中的每个拷贝。

在又一实施方式中,引用阈值包括对数据块的引用次数。

在又一实施方式中,其中经重复消除的数据被布置在数据卷中,其中至少一个数据卷包括多个数据块,确定步骤所确定的对数据块的引用不包括对相同数据卷中的数据块的多次引用。

在另一实施方式中,其中经重复消除的数据被布置在数据卷中,其中至少一个数据卷包括多个数据块,确定步骤所确定的对数据块的引用包括对相同数据卷中的数据块的多次引用。

在又一实施方式中,引用阈值次数是对数据块的一次引用。

在另一实施方式中,引用阈值包括大于1的基于风险的阈值。

在又一实施方式中,备份经重复消除的数据包括:包括确定例如上下文中对每个数据块的引用的步骤;包括将上下文中的多次引用总数与百分比阈值进行比较的步骤;以及包括在百分比阈值被超过的情况下存储上下文的所有数据块的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080006849.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top