[发明专利]一种确定相似文件的方法及装置有效
申请号: | 200710166548.3 | 申请日: | 2007-11-05 |
公开(公告)号: | CN101184091A | 公开(公告)日: | 2008-05-21 |
发明(设计)人: | 陈涛 | 申请(专利权)人: | 深圳市迅雷网络技术有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L9/32 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 刘松 |
地址: | 518057广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 相似 文件 方法 装置 | ||
1.一种确定相似文件的方法,其特征在于,包括以下步骤:
获得两个文件的相关信息并确定两个文件的内容数据不完全相同;
分别获得所述两个文件相同长度的数据对应的内容签名;
将所述两个文件中一个文件对应的内容签名分别与另一个文件对应的内容签名进行比较,并确定存在比较结果一致的内容签名;
确定所述两个文件相似。
2.如权利要求1所述的方法,其特征在于,通过将所述两个文件的文件内容签名进行比较,确定所述两个文件的内容数据不完全相同。
3.如权利要求1所述的方法,其特征在于,在分别获得所述两个文件的分块数据的内容签名之前,根据预设的分块策略分别对所述两个文件进行分块。
4.如权利要求3所述的方法,其特征在于,所述分块数据的内容签名是根据预设的算法对分块数据进行计算后获得的;或者
所述分块数据的内容签名是:进一步对所述分块数据进行分块,获得多个子分块数据,并根据预设的算法分别对多个子分块数据进行计算,获得多个子分块数据的内容签名,以及根据所述算法对合并后的多个子分块数据的内容签名进行计算,获得所述分块数据的内容签名。
5.如权利要求4所述的方法,其特征在于,采用树型结构记录所述文件内容签名、分块数据的内容签名及子分块数据的内容签名之间的关系。
6.如权利要求5所述的方法,其特征在于,分别获得所述两个文件的分块数据的内容签名的步骤包括:通过根据文件内容签名对相应的树型结构进行广度遍历,获得文件的分块数据的内容签名。
7.如权利要求4所述的方法,其特征在于,采用二维数组或二维列表将所述文件内容签名、分块数据的内容签名及子分块数据的内容签名记录在不同的行或列中。
8.如权利要求1所述的方法,其特征在于,进一步记录比较结果一致的内容签名所对应的分块数据分别在所述两个文件中的位置。
9.如权利要求8所述的方法,其特征在于,所述位置包括在文件中的实际位置和/或关于另一个文件的相对位置。
10.一种下载文件的方法,其特征在于,包括以下步骤:
确定需要下载第一文件;
获得第一文件中分块数据的内容签名,并确定第二文件对应有与第一文件中相同的分块数据的内容签名;
确定从第二文件中下载所述相同的分块数据。
11.如权利要求10所述的方法,其特征在于,第一文件与第二文件不完全相同。
12.如权利要求11所述的方法,其特征在于,通过将第一文件内容签名与第二文件内容签名进行比较,确定第一文件与第二文件不完全相同。
13.如权利要求10所述的方法,其特征在于,所述分块数据的内容签名是根据预设的算法对分块数据进行计算后获得的;或者
所述分块数据的内容签名是:进一步对所述分块数据进行分块,获得多个子分块数据,并根据预设的算法分别对多个子分块数据进行计算,获得多个子分块数据的内容签名,以及根据所述算法对合并后的多个子分块数据的内容签名进行计算,获得所述分块数据的内容签名。
14.如权利要求13所述的方法,其特征在于,采用树型结构记录文件内容签名、分块数据的内容签名及子分块数据的内容签名之间的关系。
15.如权利要求14所述的方法,其特征在于,获得第一文件中分块数据的内容签名的步骤包括:通过对关于第一文件的树型结构进行广度遍历,获得第一文件的分块数据的内容签名。
16.如权利要求15所述的方法,其特征在于,确定第二文件对应有与第一文件中相同的分块数据的内容签名的步骤包括:根据获得的第一文件的分块数据的内容签名对关于其它文件的树型结构进行遍历,确定对应有该内容签名的第二文件。
17.如权利要求15所述的方法,其特征在于,存有第一文件的分块数据的内容签名与对应有该内容签名的文件的对应关系,在获得第一文件中分块数据的内容签名后,根据获得的第一文件中分块数据的内容签名查找所述对应关系,确定第二文件对应有与第一文件中相同的分块数据的内容签名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市迅雷网络技术有限公司,未经深圳市迅雷网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710166548.3/1.html,转载请声明来源钻瓜专利网。