[发明专利]数据采样去重在审
申请号: | 201280068650.9 | 申请日: | 2012-03-08 |
公开(公告)号: | CN104067238A | 公开(公告)日: | 2014-09-24 |
发明(设计)人: | M.D.利利布里奇 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | G06F12/00 | 分类号: | G06F12/00;G06F12/06 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张凌苗;马永利 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 采样 | ||
1. 一种用于去重的计算机系统,包括:
索引,用于存储关于数据块的信息;
接收机模块,用于接收包括第一数据块的一系列数据块;以及
索引器模块,用于:
如果所述第一数据块是采样数据块且关于所述第一数据块的信息不在所述索引中,则将关于所述第一数据块的信息存储在所述索引中,以及
如果所述第一数据块不是采样数据块且关于所述第一数据块的信息不在所述索引中,则部分地基于所述第一数据块是否在信息被存储在所述索引中的数据块附近来决定是否将关于所述第一数据块的信息存储在所述索引中。
2. 如权利要求1所述的计算机系统,其中采样模块配置成通过检查所述第一数据块的散列值是否具有预定特性来决定所述第一数据块是否是采样数据块。
3. 如权利要求1所述的计算机系统,其中所述索引器模块配置成通过检查所述第一数据块是否在信息在所述索引中的所述系列数据块之一的预定距离内来决定所述第一数据块是否在信息被存储在所述索引中的数据块附近。
4. 如权利要求1所述的计算机系统,其中所述索引器模块配置成通过检查所述第一数据块是否在信息被存储在所述索引中的所述系列数据块中的至少预定数量的数据块附近来决定所述第一数据块是否在处于所述索引中的数据块附近。
5. 如权利要求1所述的计算机系统,其中所述索引器模块还配置成如果关于非采样数据块的信息已存储在所述索引中一段预定的时间段则从所述索引移除关于所述非采样数据块的信息。
6. 如权利要求1所述的计算机系统,其中所述索引器模块还配置成从所述索引移除关于随机非采样数据块的信息。
7. 一种去重的方法,包括:
接收包括第一数据块的一系列数据块;
决定所述第一数据块是否是采样数据块;
如果所述第一数据块是采样数据块且关于所述第一数据块的信息不在所述索引中,则将关于所述第一数据块的信息存储在所述索引中;以及
如果所述第一数据块不是采样数据块且关于所述第一数据块的信息不在所述索引中,则部分地基于所述第一数据块是否在信息被存储在所述索引中的数据块附近来决定是否将关于所述第一数据块的信息存储在所述索引中。
8. 如权利要求7所述的方法,其中决定所述第一数据块是否是采样数据块还包括检查所述第一数据块的散列值是否具有预定特性。
9. 如权利要求7所述的方法,其中决定所述第一数据块是否在处于所述索引中的数据块附近还包括检查所述第一数据块是否在信息在所述索引中的所述系列数据块之一的数据块的预定距离内。
10. 如权利要求7所述的方法,还包括如果关于非采样数据块的信息已存储在所述索引中一段预定的时间段则从所述索引移除关于所述非采样数据块的信息。
11. 如权利要求7所述的方法,还包括从所述索引移除关于随机非采样数据块的信息。
12. 一种包括用于去重的代码的非临时计算机可读介质,所述代码如果被执行则使处理器:
接收包括第一数据块的一系列数据块;
决定所述第一数据块是否是采样数据块;
如果所述第一数据块是采样数据块且关于所述第一数据块的信息不在所述索引中,则将关于所述第一数据块的信息存储在所述索引中;以及
如果所述第一数据块不是采样数据块且关于所述第一数据块的信息不在所述索引中,则部分地基于所述第一数据块是否在信息被存储在所述索引中的数据块附近来决定是否将关于所述第一数据块的信息存储在所述索引中。
13. 如权利要求12所述的计算机可读介质,还包括如果被执行则使处理器执行下列操作的代码:
通过检查所述第一数据块的散列值是否具有预定特性来决定所述第一数据块是否是采样数据块。
14. 如权利要求12所述的计算机可读介质,还包括如果被执行则使处理器执行下列操作的代码:
通过检查所述第一数据块是否在信息在所述索引中的所述系列数据块之一的数据块的预定距离内来决定所述第一数据块是否在处于所述索引中的数据块附近。
15. 如权利要求12所述的计算机可读介质,还包括如果被执行则使处理器执行下列操作的代码:
如果关于非采样数据块的信息已存储在所述索引中一段预定的时间段则从所述索引移除关于所述非采样数据块的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280068650.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:块级存储
- 下一篇:在不同的粒度水平下对数据值进行广播和掩码的指令执行
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置