[发明专利]经重复消除的数据的备份有效
申请号: | 201080006849.X | 申请日: | 2010-01-19 |
公开(公告)号: | CN102308288A | 公开(公告)日: | 2012-01-04 |
发明(设计)人: | G·T·基施 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重复 消除 数据 备份 | ||
技术领域
本发明涉及数据重复消除,并且更特别地,涉及向数据存储介质备份经重复消除的数据。
背景技术
计算机系统采用通常部分地采用不时更新数据的应用。该数据继而通常被存储,可能首先是被存储到诸如存储器或者盘的存储库,随后被存储到诸如可拆卸介质的数据存储介质,其示例包括磁带、光盘、盒式磁盘、盒式存储器,等等。如本领域中已知的,向储存库和向数据存储介质的存储可以被称为数据的备份,并且由备份/恢复应用来进行。例如,一个用户或者一组用户可能希望向储存库备份定期(例如,每天或者每周)备份特定应用的数据或者在其计算机上存储的所有数据,以作为针对重要数据可能的崩溃、损坏或者意外删除的预防措施。
对数据流的部分更新可能源自各更新应用中的每个应用仅使用该数据流的一部分。在一个示例中,一个应用或者用户将使用和更新包括数据流一部分的一个或者多个数据集或者虚拟卷,而另一应用或者用户将使用和更新包括数据流的另一部分的一个或者多个数据集或者虚拟卷。在任一情况下,常常只有所备份的数据流中的数据集或者虚拟卷的小部分已被更新,因此当前数据的大部分可能已经存在于储存库中,只有少量改变。
用于减少储存库中所存储的相同数据的量的过程被称为数据重复消除,并且各种技术是本领域技术人员所已知的。数据重复消除最终结果是:对于相同的数据部分,该数据部分的一个拷贝被存储为第一拷贝,而将其他拷贝替换为指向第一拷贝的指针。
在此,用于数据给定部分的每个第一拷贝和指向第一拷贝的任何指针中的每一个被称为针对该数据的重复消除的“引用”。数据的没有相同拷贝的唯一的部分也被称为针对该数据的重复消除的“引用”。
由此,经重复消除的虚拟卷可以包括唯一的数据块与或者是第一拷贝或者是指向第一拷贝的指针的数据块的组合。依赖于用来创建重复消除的技术,数据块可以具有一致的或者可变的尺寸。
如本领域技术人员所知,经重复消除的数据通常始于以重复消除形式向储存库“备份”,并且通常被存储在诸如RAID之类的硬盘驱动系统上。RAID系统使用奇偶校验系统来确保数据不被丢失,即使数据的大部分可能变得被损坏等。数据可以被格式化以模仿磁带或者其他形式的可拆卸介质,但是按照可以快速恢复原始数据的方式被布置在硬盘驱动系统上。包括虚拟卷的数据流可以作为完整原始数据流而存在,并且在其被备份到储存库时被重复消除;或者它可以被重复消除并且以经重复消除形式被存储在例如临时存储中,并且继而被备份到储存库。
备份储存库本身必须不时地备份以便避免过高的成本,并且备份通常是向实际的可拆卸介质(例如磁带库)。为了恢复原始数据通常需要访问数据,并且一个库维护可拆卸介质以供快速访问,尽管它比盘驱动系统的访问更慢。当向物理带传送数据时,可以对数据进行重建以用于传送,在这种情况下其扩展和消耗大量的带,例如,扩展因子可以是10或者20。
发明内容
方法和和系统备份经重复消除的数据,该经重复消除的数据包括针对重复消除而被引用的多个数据块。
在一个实施方式中,一个步骤包括确定存在对每个数据块的多次引用;并且一个步骤包括存储具有对其的多次引用的至少每个数据块的至少两个拷贝,其中向独立的数据存储介质存储数据块的每个拷贝。
在另一实施方式中,一个步骤包括确定对每个数据块的引用;一个步骤包括比较该引用与引用阈值;一个步骤包括在引用阈值未被超过的情况下存储每个数据块的单个拷贝;以及一个步骤包括在引用阈值被超过的情况下存储每个数据块的多个拷贝。
在又一实施方式中,多个拷贝存储步骤包括向独立数据存储介质的每一个存储数据块的多个拷贝中的每个拷贝。
在又一实施方式中,引用阈值包括对数据块的引用次数。
在又一实施方式中,其中经重复消除的数据被布置在数据卷中,其中至少一个数据卷包括多个数据块,确定步骤所确定的对数据块的引用不包括对相同数据卷中的数据块的多次引用。
在另一实施方式中,其中经重复消除的数据被布置在数据卷中,其中至少一个数据卷包括多个数据块,确定步骤所确定的对数据块的引用包括对相同数据卷中的数据块的多次引用。
在又一实施方式中,引用阈值次数是对数据块的一次引用。
在另一实施方式中,引用阈值包括大于1的基于风险的阈值。
在又一实施方式中,备份经重复消除的数据包括:包括确定例如上下文中对每个数据块的引用的步骤;包括将上下文中的多次引用总数与百分比阈值进行比较的步骤;以及包括在百分比阈值被超过的情况下存储上下文的所有数据块的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080006849.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:丝杠电机
- 下一篇:一种应用于有源箝位反激式微型光伏并网逆变器装置的控制方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置