[发明专利]增加的联机去重复效率的方法和系统有效
申请号: | 201380018034.7 | 申请日: | 2013-01-08 |
公开(公告)号: | CN104205066B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | D·M·鲍德温;N·P·博萨勒;J·T·奥尔森;S·R·帕蒂尔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F12/00 | 分类号: | G06F12/00 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 酆迅,辛鸣 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了用于计算环境中的增加的联机去重复效率的示例性方法、系统和计算机程序产品实施例。在一个实施例中,仅作为示例,在n次迭代中计算用于从被请求用于联机去重复的对象提取的累积数据块的散列值。对于n次迭代中的每一次,在第n个散列索引表中将累积数据块的计算出的散列值与存储装置中的现有对象的对应散列值相匹配。在匹配期间一检测到失配就退出第n个散列索引表。失配被确定为唯一对象并被存储。对象的散列值被计算。利用对象的计算出的散列值和唯一对象的计算出的散列值来更新主散列索引表。附加系统和计算机程序产品实施例被公开并且提供相关优点。 | ||
搜索关键词: | 增加 联机 重复 效率 方法 系统 | ||
【主权项】:
一种由计算环境中的处理器设备执行的用于增加的联机去重复效率的方法,所述方法包括:在n次迭代中计算用于从被请求用于联机去重复的对象提取的用于累积数据块的散列值;对于所述n次迭代中的每一次,在第n个散列索引表中将用于所述累积数据块的计算出的所述散列值与存储装置中的现有对象中与所述累积数据块位置大小对应的散列值相匹配,其中所述第n个散列索引表针对该n次迭代的所述累积数据块中的每一个被构建;一旦在所述匹配期间检测到用于所述累积数据块之一的计算出的所述散列值的匹配,如果已到达所述用于联机去重复的对象的全尺寸,退出迭代,否则从所述用于联机去重复的对象请求继续收集数据,并与本次迭代的累积数据块结合形成下次迭代的累积数据块,进行下次迭代;一旦在所述匹配期间检测到用于所述累积数据块之一的计算出的所述散列值的失配就退出所述第n个散列索引表,其中所述失配被确定为唯一对象并被存储;以及计算用于所述用于联机去重复的对象的散列值,其中主散列索引表利用用于所述用于联机去重复的对象的计算出的所述散列值和用于所述唯一对象的计算出的所述散列值被更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380018034.7/,转载请声明来源钻瓜专利网。