[发明专利]针对小块的可伸缩重复删除系统有效
申请号: | 201280045663.4 | 申请日: | 2012-09-10 |
公开(公告)号: | CN103814361A | 公开(公告)日: | 2014-05-21 |
发明(设计)人: | L.阿罗诺维克;R.阿舍;M.赫希;S.T.克莱因;E.梅里;Y.托芙 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F12/00 | 分类号: | G06F12/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张贵东 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 小块 伸缩 重复 删除 系统 | ||
1.一种以小数据块为工作对象的可伸缩重复数据删除的方法,该方法包含:
对于每个小数据块,根据出现在小数据块中的字符的表示与小数据块的频率的表示的组合生成签名,其中将该签名用于帮助选择要重复删除的数据。
2.如权利要求1所述的方法,其中该签名具有使小数据块中的小修改引起签名小变化和没有变化之一的性质。
3.如权利要求1所述的方法,其中该签名基于小数据块的c-谱、小数据块的f-谱、和小数据块的p-谱,其中小数据块的c-谱是按小数据块中的出现频率排序的不同字符的表示的序列,小数据块的f-谱是小数据块中的不同字符的频率的对应序列,以及小数据块的p-谱是按小数据块中的出现频率排序的不同字符对的序列。
4.如权利要求3所述的方法,进一步包括,与根据c-谱、f-谱和p-谱生成签名结合,执行如下操作的一种或多种:
通过加权在有序序列中相邻的字符的频率fi之间的间隙di=fi–fi+1,将具有相似频率的c-谱的字符组合成块,其中根据权重将该间隙归一化;
选择定义c-谱的字符块的边界的间隙的子集;
对c-谱的字符块中的字符的组合进行逻辑XOR运算;
选择f-谱的频率的子集的位的子集;以及
选择p-谱的对的子集,并且为p-谱的对的每个所选子集对字符的表示对进行逻辑运算。
5.如权利要求4所述的方法,进一步包括对位的所选子集和对的所选子集进行位移操作,并通过将所选子集组合成代表签名的位串进行逻辑XOR运算。
6.如权利要求5所述的方法,进一步包括按照参数表进行位移操作。
7.如权利要求4所述的方法,其中划分间隙di=fi–fi+1的权重wi是
8.如权利要求4所述的方法,其中对字符的表示对进行的逻辑运算包括如下操作的至少一种:
循环地旋转位串;
位移该位串;以及
进行逻辑XOR运算。
9.一种在计算环境中以小数据块为工作对象的可伸缩重复数据删除的系统,包含:
可工作在计算存储环境下的至少一个处理器设备,其中该至少一个处理器设备适用于:
对于每个小数据块,根据出现在小数据块中的字符的表示与小数据块的频率的表示的组合生成签名,其中将该签名用于帮助选择要重复删除的数据。
10.如权利要求9所述的系统,其中该签名具有使小数据块中的小修改引起签名小变化和没有变化之一的性质。
11.如权利要求9所述的系统,其中该签名基于小数据块的c-谱、小数据块的f-谱、和小数据块的p-谱,其中小数据块的c-谱是按小数据块中的出现频率排序的不同字符的表示的序列,小数据块的f-谱是小数据块中的不同字符的频率的对应序列,以及小数据块的p-谱是按小数据块中的出现频率排序的不同字符对的序列。
12.如权利要求11所述的系统,其中该处理器设备进一步适用于与根据c-谱、f-谱和p-谱生成签名结合,执行如下操作的一种或多种:
通过加权在有序序列中相邻的字符的频率fi之间的间隙di=fi–fi+1,将具有相似频率的c-谱的字符组合成块,其中根据权重将该间隙归一化;
选择定义c-谱的字符块的边界的间隙的子集;
对c-谱的字符块中的字符的组合进行逻辑XOR运算;
选择f-谱的频率的子集的位的子集;以及
选择p-谱的对的子集,并且为p-谱的对的每个所选子集对字符的表示对进行逻辑运算。
13.如权利要求12所述的系统,其中该处理器设备进一步适用于对位的所选子集和对的所选子集进行位移操作,并通过将所选子集组合成代表签名的位串进行逻辑XOR运算。
14.如权利要求13所述的系统,其中该处理器设备进一步适用于按照参数表进行位移操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280045663.4/1.html,转载请声明来源钻瓜专利网。