[发明专利]基于去重复的存储系统中用于可扩展引用管理的系统和方法有效
申请号: | 201180050077.4 | 申请日: | 2011-08-31 |
公开(公告)号: | CN103238140A | 公开(公告)日: | 2013-08-07 |
发明(设计)人: | F·郭 | 申请(专利权)人: | 赛门铁克公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 重复 存储系统 用于 扩展 引用 管理 系统 方法 | ||
发明背景
发明领域
本发明总体上涉及备份存储系统,尤其是涉及用于协助基于去重复的存储系统中的资源回收的引用列表。
相关技术说明
各种组织机构正在积累并存储大量电子数据。因此,备份存储系统正在增加尺寸并消耗大量资源。为了应对数量不断增加的数据的存储,去重复技术已经成为在备份存储系统中使存储利用率最大化的一个重要特征。在典型的去重复系统中,将文件分块为数据段并且将冗余数据段从系统中删除。然后,在备份存储介质中将唯一的数据段存储为段对象。随着所存储的段对象数量的增加,段对象的管理要求提高系统资源的共享,这可能影响去重复系统的整体效率和性能。
基于去重复系统的目的是减少需要存储大量数据的大量存储容量。去重复技术已经成熟到它们可以在数量上实现所存储数据的显著减少。然而,尽管这些技术可以减少所需要的存储空间,但系统中存储的段对象的数量仍然继续增加。当去重复系统按比例增加以处理更多的数据负载时,段对象的管理和标引就成为影响系统性能的重要因素。
典型地,段对象尺寸小,在一些系统中仅有4千字节(KB)。对于存储400兆兆字节(TB)数据的系统(所有段对象大小为4KB),要维护1000亿个段对象。随着存储需求的增长,段对象数量上的增加可能产生无法接受的管理开销。因此,需要高可扩展性管理系统来有效地存储和管理大量段对象。
特别具有挑战性的问题包括在从系统删除文件后恢复资源。当删除一个文件时,不能简单地删除组成该文件的段对象,因为系统所存储的一些其他文件有可能引用了那些相同段对象的一个或多个。只要没有其他文件使用那些段对象,就可以将它们删除。某种管理形式需要持续跟踪段对象以及使用这些段对象的所有文件。存在用于管理段对象以及指向它们的文件的各种技术,当小规模操作时这些技术中的大部分可以工作良好。然而,在应对大量段对象时这些方法中的很多可能不会有效。
协助资源回收的一个技术是对段对象进行引用计数。引用数存储了一个值,该值表示有多少文件指向或使用该段。每当一个文件使用段对象时它的引用数就递增,并且当删除使用该段的文件时递减,最终当该数降为零时可以回收该段。
引用计数具有不适合于去重复的一些限制。一个限制是任何丢失或重复更新会不适当地改变该计数。如果该数偶然减少,当段仍由至少一个文件使用时可能被删除。如果该数偶然增加,那么甚至在使用该段的所有文件都从系统中删除后可能永远不会删除该段。
引用计数的另一个缺点是它不允许识别哪些文件使用一个给定段对象。如果段对象遭到破坏,备份系统需要知道哪些文件正在使用它,这样可以要求该文件恢复破坏的数据。然而,引用计数并不维护哪些文件正使用每个特定段对象的列表,这使得破坏数据的恢复更为困难。
可用于协助资源回收的另一个工具是引用列表。维护引用列表不会受到引用计数的内在缺点的影响。引用列表对错误更新具有更强的免疫力,因为可以搜索该列表以查看是否已经执行了添加或移除操作。另外,引用列表具有识别哪些文件正使用每个段对象的能力。然而,引用列表不易于扩展以便处理大量段对像。传统上,根据所存储的每个段对象在一个细等级上来管理引用列表。随着段对象数量的增加,更新引用列表耗费更长的时段,这可能降低系统性能。需要一种新方法,以维护可以有效管理大量段对象的引用列表。
鉴于以上问题,维护去重复系统中的引用列表的改进方法和机制是需要的。
发明综述
设想了有效管理基于去重复的存储系统中的引用列表的方法和机制的各种实施例。在一个实施例中,引用列表可以包括在备份存储介质中存储的每个容器的粗等级条项组成。由在特定容器内存储的至少一个段对象组成的每个文件可以在该特定容器的引用列表中具有一个条项。当文件添加到基于去重复的存储系统中或从其删除时,条项可以添加到引用列表或从其删除。在另一个实施例中,引用列表可以包括用于容器的粗等级条项以及用于在容器中存储的段对象的细等级条项。引用列表可以在粗等级上进行管理,这样存储系统的文件的删除可以产生更新的容器条项,无需更新段对象条项。当用于一个特定容器的粗等级条项的数量减少时,最终该数量将降至一个阈值以下,在该阈值点上服务器可以切换回在细等级上管理该特定容器的列表。在细等级上管理引用列表可以包括每次从系统中删除一个文件时就更新段对象条项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛门铁克公司,未经赛门铁克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180050077.4/2.html,转载请声明来源钻瓜专利网。