[发明专利]数据去重复的备份和还原策略有效
申请号: | 201210062939.1 | 申请日: | 2012-03-09 |
公开(公告)号: | CN102736961B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | R·卡拉赫;C·H(I)·张;P·A·奥尔泰安;M·J·迪克森 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 杨洁 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 重复 备份 还原 策略 | ||
技术领域
本发明涉及数据去重复,尤其是数据去重复的备份和还原策略。
背景技术
数据去重复,也称为数据优化,是减少需要储存在盘上或需要跨网络进行传送的数据的物理字节量而不会损害原始数据的保真性或完整性的动作。数据去重复减少了存储数据所需的存储容量,并且可因此导致存储硬件成本和数据管理成本方面的节省。数据去重复提供了处理快速增长的数字地储存的数据的解决方案。
数据去重复可根据用于消除各持久存储的文件之内和之间的冗余的一项或多项技术来执行。例如,根据一项技术,在一个或多个文件中出现多次的唯一数据区域可被标识,并且那些经标识的唯一数据区域的单一副本可被物理地储存。可储存对那些经标识的唯一数据区域(也称为数据“块”)的引用,引用指示了包含这些唯一数据区域的各文件以及在这些文件中的位置。该技术一般称为单一实例化。除了单一实例化以外,还可执行对数据的压缩。其他数据减少技术也可被实现为数据去重复解决方案的一部分。
管理根据数据去重复技术储存的数据存在困难。例如,由于由数据去重复所强加的数据碎片,在访问根据去重复储存的文件时可能存在等待时间。该等待时间限制了对数据去重复解决方案的采用,尤其是对主存储数据,在主存储数据中用户期望对文件的无缝的、快速的访问。而且,数据去重复算法可在专用装置上运行,或者在存储和提供数据的设备(例如,文件服务器)上运行。在文件服务器的示例中,数据去重复可能不是该设备的主要功能,并且因此可能需要数据去重复技术是高效的,以免过度消耗设备资源(例如,存储器、输入/输出(I/O)机制、中央处理单元(CPU)容量等)。而且,因为数字数据量以非常高的速度增长,所以存储设备(例如,存储盘)的大小以及与计算设备相关联的总存储容量正在增大,从而导致关于不能随着增加存储量而进行很好地伸缩的数据去重复技术的困难。由于对数据的压缩,数据去重复使得能够执行更小的数据备份和更快速的数据备份,并且作为结果地使得能够更快地还原已备份的数据。然而,备份已去重复的数据以及从备份存储中还原已去重复的数据中存在着挑战。
发明内容
提供本发明内容以便以简化形式介绍将在以下具体实施方式中进一步描述的一些概念。本发明内容并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。
提供用于将经优化数据流备份到备份存储以及用于从备份存储还原数据流的方法、系统和计算机程序产品。在本说明书中,经优化数据指已被优化的数据或者已由数据去重复技术(诸如块的单一实例化和压缩等)中的一种或多种进行了去重复的数据。经优化流指被去重复的流,或换言之,它们的数据已使用数据去重复技术被优化。
例如,描述了用于备份经优化数据流的实现。块存储包括多个经优化数据流,每个经优化数据流具有包括至少一个数据块的多个块、以及将数据块的标识符映射到数据块在块存储中的位置的经优化流元数据(例如,块存储的块容器中作为流映射块来储存的流映射、全局表、数据库等)。块存储以已去重复的方式包括数据块。可以标识在块存储中储存的一个或多个经优化数据流以供备份。为了备份所标识的经优化数据流,块存储的至少一部分被储存在备份存储中。根据所选择的备份技术,(其一部分、或整体上)块存储被储存在备份存储中。
例如,根据经优化备份技术,块存储的一个或多个块容器被整体上储存在备份存储中。多个经优化流结构被储存在备份存储中。经优化流结构是为备份所标识的经优化数据流的重解析点。
根据未经优化备份技术,为备份所标识的每个经优化数据流被再水合为包括由经优化数据流的元数据所引用的任一数据块的对应的未经优化数据流。每个未经优化数据流被储存在备份存储中。
根据项目级备份技术,第一经优化数据流被标识以供备份。确定由尚未被储存到备份存储中的第一经优化数据流的元数据所引用的一个或多个数据块。第一经优化数据流的经优化流元数据被储存到备份存储中。被确定为尚未被备份的数据块也被储存在备份存储中。为备份所标识的每个经优化数据流可按照类似的方式被储存在备份存储中。
根据数据块标识符备份技术,分析每个经优化数据流的经优化流元数据以确定经优化流元数据所引用的数据块的数据块标识符。每个经优化数据流的经优化流结构与对应的至少一个数据块标识符被储存在备份存储中。块存储的存储被引用的数据块的一个或多个块容器被储存到备份存储中。
可以基于试探法来选择备份技术。执行所选择的备份技术以在备份存储中备份多个经优化数据流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210062939.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置