[发明专利]用于数据去重的方法和设备在审

专利信息
申请号: 201611193455.5 申请日: 2016-12-21
公开(公告)号: CN108228083A 公开(公告)日: 2018-06-29
发明(设计)人: 吴飞;邹勇;肖林;叶诚;吴鹏 申请(专利权)人: 伊姆西IP控股有限责任公司
主分类号: G06F3/06 分类号: G06F3/06
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华
地址: 美国马*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 存储节点 主存储 去重 备份 方法和设备 采样数据 目标存储节点 节点发送 节点接收 客户端处 数据采样 客户端 集群 存储 发送 响应
【说明书】:

本公开的实施例公开了用于数据去重的方法和设备。在客户端执行的数据去重的方法包括:响应于在客户端处接收到待备份的数据,对所述待备份的数据采样以得到采样数据;生成用于所述采样数据的签名;向包括多个存储节点的存储集群中的主存储节点发送所述签名,以允许所述主存储节点从所述多个存储节点中选择一个存储节点;从所述主存储节点接收所选择的存储节点的指示;以及基于所述指示向所述所选择的目标存储节点发送所述待备份的数据。本公开的实施例还提供在主存储节点和从存储节点处执行的数据去重方法,以及相应的设备。

技术领域

本公开的实施例总体上涉及数据处理方法和设备,并且具体地,涉及对存储系统中重复冗余数据的去重方法和设备。

背景技术

在数据存储系统尤其是在备份和归档存储系统中,数据的冗余度通常较高。而在某个周期时段内,所存储数据的变化可能并不大。例如在虚拟机的应用场景中,数据中心存在成千上万的虚拟机应用,存储空间需求庞大,而每天每个虚拟机的变化一般较小,例如每天50MB的数据变化。因此,在这样的存储系统中需要改善存储空间的利用以及优化存储,以减少数据在磁盘上的占用空间。其中一种有效的解决方案是利用重复数据删除(de-duplication)技术。

重复数据删除技术是一种基于冗余数据去除的特殊数据压缩技术,旨在减少存储系统中使用的存储容量。然而,面对数据的高速增长,单一的重复数据删除服务器已经难以满足扩展性的需求。因此,横向扩展(scaleout)存储系统或集群存储系统应运而生。也就是说,在集群存储系统中,存在多个重复数据删除服务器(或称之为集群节点)。然而传统的数据去重方案无法在实现良好去重效果的同时确保整个存储系统的负载均衡和/或最小化对上层应用的影响。

发明内容

总体上,本公开的实施例提供一种优化集群存储系统的数据去重处理的解决方案。

在本公开的第一方面,提供一种用于数据去重的方法。该方法包括:一种数据去重的方法,包括:响应于在客户端处接收到待备份的数据,对待备份的数据采样以得到采样数据;生成用于采样数据的签名;向包括多个存储节点的存储集群中的主存储节点发送签名,以允许主存储节点从多个存储节点中选择一个存储节点;从主存储节点接收所选择的存储节点的指示;以及基于指示向所选择的目标存储节点发送待备份的数据。

在某些实施例中,多个存储节点以固定长度的分段来存储数据,并且对待备份的数据采样包括:基于固定长度对待备份的数据进行分段以得到多个数据段;以及对多个数据段采样以得到多个采样数据段。

在某些实施例中,多个存储节点以可变长度的分段来存储数据,并且对待备份的数据采样包括执行以下一次或多次:随机地选择用于采样的起始位置;从起始位置起,以与可变长度相对应的模式来识别待备份的数据的预定数目的锚点;以及采样紧随锚点的数据段作为采样数据段。在某些实施例中,其中对采样数据生成签名包括对采样数据段进行数字签名以获得指纹,并且其中向主存储节点发送签名包括向主存储节点发送指纹。

在某些实施例中,对待备份的数据采样包括:响应于待备份的数据的大小低于第一预定阈值,对待备份的数据进行分段以得到多个数据段作为采样数据。

在某些实施例中,对采样数据生成签名包括:对多个数据段进行数字签名以获得与多个数据段相对应的多个指纹;以及确定多个指纹中指纹值为预定值的第一指纹。

在某些实施例中,该方法还包括:从主存储节点接收用于进行附加数据采样的附加指示;基于附加指示,对待备份的数据进行附加采样以得到附加采样数据;生成用于附加采样数据的附加签名;以及向主存储节点发送附加签名。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611193455.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top