[发明专利]将去除了重复的数据打包到有限大小容器中的方法和系统在审

专利信息
申请号: 201310242409.X 申请日: 2013-06-19
公开(公告)号: CN103514247A 公开(公告)日: 2014-01-15
发明(设计)人: M·海尔什;T·卡罗斯 申请(专利权)人: 国际商业机器公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 吴信刚
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 除了 重复 数据 打包 有限 大小 容器 中的 方法 系统
【权利要求书】:

1.一种使用处理器装置将去除了重复的数据打包到多个有限大小容器中的方法,包括:

计算去除了重复的数据的多个相似比较文件之间的相似性分数;以及

使用该相似性分数将去除了重复的数据的所述多个相似比较文件分组成子集,用于使每个所述子集从去除重复系统离台到所述多个有限大小容器中的一个。

2.根据权利要求1所述的方法,还包括在创建去除了重复的数据的所述多个相似比较文件的摄取时间,将去除重复系统中之前去除重复的数据文件与进入去除重复系统中要被去除重复的新数据文件进行比较。

3.根据权利要求1所述的方法,其中,计算相似性分数还包括,计算去除了重复的数据的所述多个相似比较文件之间共享的共同数据交集的第n百分数阈值,其中确定去除了重复的数据的所述多个相似比较文件之间的传递闭包。

4.根据权利要求3所述的方法,还包括使用所述传递闭包以帮助使用相似性分数将去除了重复的数据的所述多个相似比较文件分组成子集。

5.根据权利要求4所述的方法,还包括通过遍历每个所述子集以确定所述多个有限大小容器中的一个的要求存储空间来计算存储度量值。

6.根据权利要求3所述的方法,还包括在文件相似性索引中保持所述多个相似比较文件中的每个的标识以及针对所述多个相似比较文件中的每个计算的相似性分数。

7.根据权利要求1所述的方法,还包括接收要将所述多个相似比较文件中的哪些分组成子集用于使每个所述子集从去除重复系统离台到所述多个有限大小容器中的一个的用户指示。

8.一种用于在计算环境中将去除了重复的数据打包成多个有限大小容器的系统,包括:

处理器装置,在计算环境中可操作,其中至少一个处理器装置适于:

计算去除了重复的数据的多个相似比较文件之间的相似性分数;以及

使用该相似性分数将去除了重复的数据的所述多个相似比较文件分组成子集,用于使每个所述子集从去除重复系统离台到所述多个有限大小容器中的一个。

9.根据权利要求8所述的系统,其中,处理器装置还适于在创建去除了重复的数据的所述多个相似比较文件的摄取时间,将去除重复系统中之前去除重复的数据文件与进入去除重复系统中要被去除重复的新数据文件进行比较。

10.根据权利要求8所述的系统,其中,为了计算所述相似性分数,处理器装置还适于计算去除了重复的数据的所述多个相似比较文件之间共享的共同数据交集的第n百分数阈值,其中确定去除了重复的数据的所述多个相似比较文件之间的传递闭包。

11.根据权利要求10所述的系统,其中,处理器装置还适于使用所述传递闭包以帮助使用相似性分数将去除了重复的数据的所述多个相似比较文件分组成子集。

12.根据权利要求11所述的系统,其中处理器装置还适于通过遍历每个所述子集以确定所述多个有限大小容器中的一个的要求存储空间来计算存储度量值。

13.根据权利要求10所述的系统,其中,处理器装置还适于在文件相似性索引中保持所述多个相似比较文件中的每个的标识以及针对所述多个相似比较文件中的每个计算的相似性分数。

14.根据权利要求8所述的系统,其中,处理器装置还适于接收要将所述多个相似比较文件中的哪些分组成子集用于使每个所述子集从去除重复系统离台到所述多个有限大小容器中的一个的用户指示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310242409.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top