[发明专利]分布式存储的方法、装置和系统在审
申请号: | 201310050257.3 | 申请日: | 2013-02-08 |
公开(公告)号: | CN103984607A | 公开(公告)日: | 2014-08-13 |
发明(设计)人: | 冯斌;黄澄;龚学文 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F12/08 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;肖鹂 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 存储 方法 装置 系统 | ||
技术领域
本发明涉及数据存储领域,尤其是涉及一种分布式存储的方法、装置和系统。
背景技术
在分布式存储系统中,为了实现可靠性,采用文件级别的多副本冗余技术,或者采用数据块级别的冗余编码技术,例如,纠删编码(Erasure Coding)技术。在多副本冗余技术中,可以通过为一份数据文件存储多份的相同的副本来降低数据丢失的概率,而在冗余编码技术中,可以通过为文件中的任何局部数据增加校验块来提高可靠性。
通常,可以采用分布式哈希表(Distributed Hash Table,DHT)对数据块和校验块进行存储。然而,由于DHT的随机性,因此无法避免将同一数据切片的多个数据块部署在同一物理存储节点上,从而无法避免单一物理存储节点(例如,机架、服务器、或硬盘时)失效导致数据丢失的风险。例如,采用M+N的纠删编码技术,其中M为数据块个数,N为校验块个数,当有N+1个以上的数据块或校验块部署在同一个硬盘上时,该硬盘故障将导致上述M个数据块的丢失,从而可能导致整个文件不可用。以12+3的冗余存储机制为例,当4个以上的数据块丢失时,数据切片会丢失并且无法恢复。
换句话说,在现有的分布式存储系统中,单点(例如,硬盘、服务器或机架)故障可能会导致数据丢失,尤其在分布式存储系统的规模较小时,故障的风险和概率特别大,从而降低了分布式存储系统的可靠性。
发明内容
本发明的实施例提供了一种分布式存储系统和分布式存储方法、装置和系统,能够提高分布式存储系统的可靠性。
第一方面,提供了一种分布式存储方法,包括:对数据文件进行分割,生成K个数据切片,对K个数据切片中的每个数据切片进行分割,针对每个数据切片生成M个数据块,并且采用冗余算法对M个数据块进行校验编码,生成N个校验块;利用随机算法确定与M个数据块或N个校验块中的一个数据块或一个校验块对应的第一物理存储节点,并且基于第一物理存储节点按照符合预设规则的第一排序方式确定至少M+1个不同的物理存储节点;将M个数据块和N个校验块中的至少M+1个块分别存储在至少M+1不同的物理存储节点上,K、M和N为正整数。
结合第一方面,在第一种可能的实现方式中,上述利用随机算法确定与M个数据块或N个校验块中的一个数据块或校验块对应的第一物理存储节点,包括:对M个数据块或N个校验块中的一个数据块或校验块的标识符进行哈希计算生成关键值;根据关键值确定与M个数据块或N个校验块中的一个数据块或者校验块对应的物理存储节点,并将物理存储节点作为的第一物理存储节点。
结合第一方面,在第二种可能的实现方式中,上述利用随机算法确定与M个数据块或N个校验块中的一个数据块或校验块对应的第一物理存储节点,包括:对分割成M个数据块的数据切片的标识符进行哈希计算生成关键值;根据关键值确定与M个数据块或N个校验块中的一个数据块或者校验快对应的物理存储节点,并将物理存储节点作为的第一物理存储节点。
结合第一方面或上述任何一种可能的实现方式,在第三种可能的实现方式中,上述基于所确定的第一物理存储节点按照第一排序方式确定至少M+1个不同的物理存储节点,包括:基于第一物理存储节点按照第一排序方式确定M+N个不同的物理存储节点,其中上述将M个数据块和N个校验块中的至少M+1个块分别存储在至少M+1个不同的物理存储节点上,包括:将M个数据块和N个校验块分别存储在M+N个不同的物理存储节点上。
结合第一方面或上述任何一种可能的实现方式,在第四种可能的实现方式中,上述基于第一物理存储节点按照第一排序方式确定至少M+1个不同的物理存储节点,包括:将所述第一物理存储节点与所述至少M+1个块中的1个块对应,以第一物理存储节点的位置为基准,按照第一排序方式确定至少M+1个块中的其它至少M个块对应的物理存储节点,其中M+1个不同的物理存储节点包括第一物理存储节点;或者,以第一物理存储节点的位置为基准,按照第一排序方式确定至少M+1个块对应的物理存储节点,其中M+1个不同的物理存储节点不包括第一物理存储节点。
结合第一方面或上述任何一种可能的实现方式,在第五种可能的实现方式中,不同的物理存储节点为硬盘,硬盘的数目等于或者大于M+1;或者,不同的物理存储节点为服务器,其中服务器的数目等于或者大于M+1;或者,不同的物理存储节点为机架,其中机架的数目等于或者大于M+1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310050257.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电连接器
- 下一篇:新能源电动自行车的太阳能电池板的点胶装置