[发明专利]采用可搜索块的内容可寻址存储系统和方法有效
申请号: | 200910174372.5 | 申请日: | 2009-09-11 |
公开(公告)号: | CN101685468A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | C·昂古里努;C·杜布尼基 | 申请(专利权)人: | 美国日本电气实验室公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王 岳;李家麟 |
地址: | 美国新*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采用 搜索 内容 寻址 存储系统 方法 | ||
相关申请信息
本申请要求通过引用而结合到本文的于2008年9月11日提交的 临时申请序列号61/095,994和通过引用而结合到本文的于2009年7 月29日提交的非临时申请12/511,126的优先权。
技术领域
本发明一般涉及管理存储介质上的数据存储,更具体而言,涉及 使用辅助存储系统上的可搜索数据块来管理数据内容的存储。
背景技术
用于存储信息的一般机制是内容可寻址存储(Content Addressable Storage,CAS)系统,其使数据块的地址基于其内容而不是预定的存 储位置。通常,CAS系统被用于辅助或“永久性”存储器中的相对固定 内容的快速存储和检索。内容可寻址存储(CAS)系统通过使用内容 的地址来提供对存储数据的访问。一般通过将若干信息片组合起来形 成内容地址(CA),所述若干信息片中的至少一个取决于存储对象的 内容。通常,通过对于对象的相关数据块的内容应用诸如SHA-1之类 的强散列函数来得出内容地址的至少一部分。
与传统存储系统相反,在一旦写入(write)数据块、则不能将其 改变的意义上,基于内容地址的存储系统是不变的,因为改变块的数 据内容还将改变其地址。这不仅向用户提供所检索的数据与所存储的 数据完全相同的某种保证,而且其还允许系统避免存储重复块。例如, 如果用户对相同的数据执行多次写操作,则系统将只存储该数据的一 份拷贝,并对于每个写操作都返回相同的内容地址。这是可能的,因 为数据块的地址由系统来确定。然而,应注意的是,虽然在本文中将 CAS系统描述为不变的,但不应将“不变”解释为意指不能删除数据 块。相反,应将“不变”解释为意指系统防止能够用已被用于不同数据 内容的内容地址来引用数据内容。
遗憾的是,当采用CAS系统时,用户必须在写入对象之后存储 CA,以便保持在稍后检索或读取该对象的能力。例如,因为由于散列 函数的使用而不能在没有原始内容的情况下得出CA,所以用户不能 在未存储内容地址的情况下检索块。另外,即便使用诸如EMS的 C-clip之类的其中将CA嵌入存储对象以允许创建有向非循环图 (DAG)的高级系统,DAG的根也是包括在没有内容的情况下不可 得出的地址位的CA。在写入对象时,C-clip的内容地址被返回到必须 将其存储在不同位置的应用程序。
因此,采用CAS的当前存储系统不是独立的(self-contained), 因为其需要保持(retain)根块的CA、且在许多系统中还保持其它块 的CA的单独存储器。
发明内容
因此,为了提高存储效率,需要一种不需要使用单独存储空间来 保持数据块的地址的CAS系统。依照本发明的各种示例性实施方式, 下文所讨论的“可搜索块”的使用消除了对维持用于数据块根的地址的 单独存储器的任何需要。例如,可以依照不必基于块内容的散列(hash) 且用户可简单地记起的用户定义搜索关键字来存储并引用(reference) 被实现为保留根(retention root)的可搜索块。另外,如下文所讨论 的,可以对其余DAG进行内容寻址以允许CAS系统的所有其它特征 的无缝操作。
本发明的一个示例性实施例包括存储在存储介质上的内容可寻 址数据结构系统,该系统包括:一组不变规则块(regular block),其 中每个规则块可用由该系统根据相应规则块的数据内容而得出的内 容地址来引用;以及一组不变可搜索块,其中每个可搜索块可用相应 可搜索块的用户定义搜索关键字来引用,并且其中,每个可搜索块是 有向非循环图(DAG)的根,该有向非循环图包括所述规则块的至少 一个子集作为DAG节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国日本电气实验室公司,未经美国日本电气实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910174372.5/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法