[发明专利]重复数据删除的数据区块切分方法与新增方法无效
申请号: | 201010564586.6 | 申请日: | 2010-11-17 |
公开(公告)号: | CN102467571A | 公开(公告)日: | 2012-05-23 |
发明(设计)人: | 朱明胜;王云松;陈志丰 | 申请(专利权)人: | 英业达股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 梁挥;祁建国 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重复 数据 删除 区块 切分 方法 新增 | ||
1.一种重复数据删除的数据区块切分方法,应用在一文件备份程序中,用以将一输入文件进行文件切割为多个数据区块,其特征在于,包括以下步骤:
载入该输入文件;
利用一固定长度的一滑动窗口在该输入文件中循序移动,并记录该滑动窗口于该输入文件的一起始位置,且同时记录当前该滑动窗口位于该输入文件的一尾端位置,将该起始位置与该尾端位置间的长度定义为一分块长度;
根据该滑动窗口对该输入文件的该固定长度的所涵盖范围进行一指纹特征程序,用以产生一指纹特征值;
重复该滑动窗口的移动,直至该滑动窗口符合一切分条件时,则停止该滑动窗口的移动,再根据该输入文件的该分块长度产生相应的该数据区块;以及
依据该滑动窗口在前一该数据区块的该尾端位置作为新的该滑动窗口的该起始位置,并重复执行产生该数据区块的步骤,直至完成该输入文件中的所有该些数据区块为止,且产生该些指纹特征值的一索引文件。
2.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该切分条件为:当该分块长度符合一预设长度时,则停止该滑动窗口的移动。
3.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该切分条件包括:当该指纹特征值符合一切分数值时,则停止该滑动窗口的移动。
4.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该切分条件更包括以下步骤:
对该指纹特征值进行模数处理,并判断处理结果是否符合一切分数值;
若该指纹特征值符合该切分数值,则停止该滑动窗口的滑动;
若该指纹特征值不符合该切分数值,则判断该分块长度是否符合一预设长度;
若该分块长度符合该预设长度,则停止该滑动窗口的滑动;以及
若该分块长度不符合该预设长度,移动该滑动窗口并重复判断该切分条件。
5.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该指纹特征程序为卷动式哈希程序(rolling hash)。
6.一种应用权利要求1的重复数据删除的数据区块新增方法,应用于已经过重复数据删除处理的该输入文件,并于该输入文件中增加新的该数据区块,其特征在于,该数据区块新增方法包括以下步骤:
载入一新增文件,该新增文件至少包含该输入文件的内容;
对该新增文件进行一数据区块切分程序,产生多组该数据区块;
对每一该数据区块进行一哈希程序,计算每一该数据区块所相应的一哈希值;
依序比对每一该哈希值是否与该些指纹特征值相同;
当该哈希值与该指纹特征值不相同时,则在该索引文件中将该哈希值插入前一相同该数据区块的该指纹特征值之后;以及
重复比对该哈希值与该些指纹特征值,直至完成所有的该些哈希值的比对为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010564586.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:造船生产流程控制方法及控制装置
- 下一篇:文件备份方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置