[发明专利]重复数据删除的数据区块切分方法与新增方法无效

专利信息
申请号: 201010564586.6 申请日: 2010-11-17
公开(公告)号: CN102467571A 公开(公告)日: 2012-05-23
发明(设计)人: 朱明胜;王云松;陈志丰 申请(专利权)人: 英业达股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京律诚同业知识产权代理有限公司 11006 代理人: 梁挥;祁建国
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 重复 数据 删除 区块 切分 方法 新增
【权利要求书】:

1.一种重复数据删除的数据区块切分方法,应用在一文件备份程序中,用以将一输入文件进行文件切割为多个数据区块,其特征在于,包括以下步骤:

载入该输入文件;

利用一固定长度的一滑动窗口在该输入文件中循序移动,并记录该滑动窗口于该输入文件的一起始位置,且同时记录当前该滑动窗口位于该输入文件的一尾端位置,将该起始位置与该尾端位置间的长度定义为一分块长度;

根据该滑动窗口对该输入文件的该固定长度的所涵盖范围进行一指纹特征程序,用以产生一指纹特征值;

重复该滑动窗口的移动,直至该滑动窗口符合一切分条件时,则停止该滑动窗口的移动,再根据该输入文件的该分块长度产生相应的该数据区块;以及

依据该滑动窗口在前一该数据区块的该尾端位置作为新的该滑动窗口的该起始位置,并重复执行产生该数据区块的步骤,直至完成该输入文件中的所有该些数据区块为止,且产生该些指纹特征值的一索引文件。

2.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该切分条件为:当该分块长度符合一预设长度时,则停止该滑动窗口的移动。

3.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该切分条件包括:当该指纹特征值符合一切分数值时,则停止该滑动窗口的移动。

4.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该切分条件更包括以下步骤:

对该指纹特征值进行模数处理,并判断处理结果是否符合一切分数值;

若该指纹特征值符合该切分数值,则停止该滑动窗口的滑动;

若该指纹特征值不符合该切分数值,则判断该分块长度是否符合一预设长度;

若该分块长度符合该预设长度,则停止该滑动窗口的滑动;以及

若该分块长度不符合该预设长度,移动该滑动窗口并重复判断该切分条件。

5.如权利要求1所述的重复数据删除的数据区块切分方法,其特征在于,该指纹特征程序为卷动式哈希程序(rolling hash)。

6.一种应用权利要求1的重复数据删除的数据区块新增方法,应用于已经过重复数据删除处理的该输入文件,并于该输入文件中增加新的该数据区块,其特征在于,该数据区块新增方法包括以下步骤:

载入一新增文件,该新增文件至少包含该输入文件的内容;

对该新增文件进行一数据区块切分程序,产生多组该数据区块;

对每一该数据区块进行一哈希程序,计算每一该数据区块所相应的一哈希值;

依序比对每一该哈希值是否与该些指纹特征值相同;

当该哈希值与该指纹特征值不相同时,则在该索引文件中将该哈希值插入前一相同该数据区块的该指纹特征值之后;以及

重复比对该哈希值与该些指纹特征值,直至完成所有的该些哈希值的比对为止。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010564586.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top