[发明专利]针对云存储系统中重复冗余数据的高效去重方法有效
申请号: | 201510848801.8 | 申请日: | 2015-11-27 |
公开(公告)号: | CN105487818B | 公开(公告)日: | 2018-11-09 |
发明(设计)人: | 张广艳;杨松霖;舒继武;郑纬民 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种针对云存储系统中重复冗余数据的高效去重方法,包括以下步骤:多个客户端接收用户的上传数据,以数据超块作为数据路由单位,并提取其中的路由特征指纹,用于数据路由选择;元数据服务器与数据服务器集群根据路由策略来处理客户端的数据路由选择请求,其中,数据服务器集群对路由特征指纹进行相似指纹匹配确定相似路由节点,元数据服务器根据负载均衡策略确定最终的数据路由地址;客户端与相应的数据服务器交互,接收到相似冗余数据的数据服务器对冗余数据进行高效快速去重。本发明的方法能够使云存储系统在保持高性能、大规模、高吞吐的系统特性的同时,达到高效的重复冗余数据去重效果,提升磁盘使用率,降低数据管理成本。 | ||
搜索关键词: | 冗余数据 数据服务器 去重 云存储系统 数据路由 元数据服务器 特征指纹 客户端 集群 重复 负载均衡策略 数据管理 磁盘使用率 高效快速 接收用户 路由策略 路由节点 匹配确定 系统特性 相似指纹 选择请求 上传 客户 | ||
【主权项】:
1.一种针对云存储系统中重复冗余数据的高效去重方法,其特征在于,所述系统包括多个数据存储服务器组成的集群以及多个客户端,其中,所述多个数据存储服务器组成的集群包括由多个数据服务器组成的数据服务器集群和一个元数据服务器,所述方法包括以下步骤:S1:所述多个客户端接收用户的上传数据,将所述数据组织成数据超块以作为数据路由单位,并提取其中的数据路由特征指纹,用于数据路由选择;S2:所述元数据服务器与数据服务器集群根据路由策略来处理所述多个客户端的数据路由选择请求,其中,所述数据服务器集群对所述数据路由特征指纹进行相似指纹匹配以确定相似路由节点,所述元数据服务器根据负载均衡策略确定最终的数据路由地址;S3:确定数据路由地址后,所述客户端与相应的数据服务器进行交互,以将相似冗余数据发送至选择的数据服务器,所述选择的数据服务器在接收到相似冗余数据后,在线对冗余数据进行快速去重。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510848801.8/,转载请声明来源钻瓜专利网。