[发明专利]基于位置敏感哈希的删冗存储系统元数据管理方法有效
申请号: | 201010294016.X | 申请日: | 2010-09-27 |
公开(公告)号: | CN101963982A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 余宏亮;孙竞 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于位置敏感哈希的删冗存储系统元数据管理方法,该方法利用位置敏感哈希函数快速将相似文件数据块元数据组织在一起,从而在对删冗存储系统写入数据块时,能快速查找到是否系统中已经存在该数据块,提高删冗存储系统的元数据查找性能,最终提高系统吞吐率。在该方法中通过设置使用的位置敏感哈希函数数量,调整相似文件识别率,从而改变元数据管理系统查询速度、内存开销和删冗效果。通过这种方法可以使元数据管理适应不同删冗存储系统要求,并且通过使用多个哈希函数可以提高相似文件识别率,提高删冗存储系统的删冗能力并减少元数据索引内存开销。 | ||
搜索关键词: | 基于 位置 敏感 存储系统 数据管理 方法 | ||
【主权项】:
一种基于位置敏感哈希的删冗存储系统元数据管理方法,其特征在于,所述方法的写数据操作包括以下步骤:S101、将文件分块,计算每个数据块的数字指纹,生成文件数字指纹集合;S102、将所述文件数字指纹集合映射到一个固定大小的存储结构中进行归一化处理,得到固定长度的输入向量;S103、根据所述输入向量计算所述文件数字指纹集合的位置敏感哈希函数值;S104、根据所述位置敏感哈希函数值查找相似文件的元数据集合的地址,根据该地址将所述相似文件的元数据集合读入内存,然后查找存在于所述文件数字指纹集合中而在所述相似文件的元数据集合中没有保存的数字指纹;所述相似文件是包含有一定数量相同数据块的文件;S105、根据步骤S104得到的所述元数据集合中没有保存的数字指纹对应的数据块生成相应的元数据,将所述相应的元数据合并到所述相似文件的元数据集合中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010294016.X/,转载请声明来源钻瓜专利网。
- 上一篇:车架装置
- 下一篇:能与地面摩擦产生金属火花的轮胎