[发明专利]数据处理方法、装置及重删处理器有效
申请号: | 201380002568.0 | 申请日: | 2013-10-30 |
公开(公告)号: | CN103930890A | 公开(公告)日: | 2014-07-16 |
发明(设计)人: | 于传帅;张程伟;张宗全;林春恭;游俊;刘强 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例,通过对数据主要按照第一查询单位的数据对应的索引值来做索引,第一查询单位包括了多个最小数据块,通过从每个最小数据块中取出部分比特位来组成对应于第一查询单位的索引值,大大缩减索引匹配时间,提升了索引匹配效率,同时也使得大幅度减少索引对内存的占用称为可能。 | ||
搜索关键词: | 数据处理 方法 装置 处理器 | ||
【主权项】:
一种数据处理方法,其特征在于,所述方法应用于数据处理系统,所述数据处理系统包括重删处理器,所述方法包括:所述重删处理器将滑动窗口所覆盖的需要重复数据查找的数据作为第一查询单位,所述第一查询单位中包括多个最小数据块,所述最小数据块为进行重复数据查找的最小查询单位的数据块;对所述第一查询单位中的数据进行索引构造和重复数据查找;所述索引构造,包括:从所述第一查询单位中每个最小数据块的指纹值中分别抽取部分比特位,将抽取的比特位组成所述第一查询单位对应的一个预设长度的索引值;所述重复数据查找,包括:在预先设置的索引表中查询是否有与所述第一查询单位对应索引值相同的索引值,若在所述索引表中查询到与所述第一查询单位对应索引值相同的第一索引值,则查找所述第一查询单位中的数据是否有与所述第一索引值对应的数据存储地址指向的目标数据重复的数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380002568.0/,转载请声明来源钻瓜专利网。
- 上一篇:用于减少浪费的卷筒纸控制及其方法
- 下一篇:自承式同轴电缆