[发明专利]一种分布式存储系统的数据分布控制方法、系统及装置有效
申请号: | 201710036337.1 | 申请日: | 2017-01-17 |
公开(公告)号: | CN108319618B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 姚文辉;陆靖;吕鹏程;常艳军;朱家稷 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/182;H04L67/1097 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 龙洪;栗若木 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 存储系统 数据 分布 控制 方法 系统 装置 | ||
一种分布式存储系统的数据分布控制方法、系统及装置,分布控制系统从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,所述多种分布策略包括跨容错域分布的策略和在一个容错域内分布的策略;然后根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入。本申请增加了数据的分布属性设置,可以适应数据的差异性要求。
技术领域
本发明涉及分布式存储系统,更具体地,涉及一种分布式存储系统的数据分布控制方法及系统、装置。
背景技术
当前的大规模分布式存储系统中,为了实现在某个容错域出现问题时数据仍然可以被访问到,采用数据多个副本跨容错域存储的方式,以抵御单个容错域故障导致的数据可用性问题。例如,Hadoop分布式文件系统(HDFS:Hadoop Distributed File System)中,将数据的多个副本分布到不同的机架进行存储。HDFS中一个机架构成一个容错域(也称为错误域),容错域代表出错的一个物理单元,通过将容错域放置在不同机架中,在某个机架的电源或者相应交换机出现故障时,仍然可以访问数据。
有些分布式存储系统会跨地域分布,在一个国家区域范围内,也会出现某个地域的供电或者网络基础设施出现故障,导致存储系统在地域内的数据不可访问,进而引起上层应用的故障。
相关技术进行分布式存储系统的数据分布控制时,先收集分布式存储系统的拓扑关系,生成整个分布式存储系统中存储节点间的拓扑关系,并自动划分好容错域。在创建数据时,指定数据要写入的副本数量,将数据的多个副本保存在多个容错域中即跨容错域分布。当有容错域出现故障导致数据的副本缺失时,可以通过数据复制过程恢复数据的副本数。
本申请的发明人发现,上述数据分布控制方法实际是认为容错域是等价的,容错域间网络带宽相同,单位价格一样,且容错域间网络传输的延迟是一样的。但是实际情况并非如此,例如在一个分层网络架构下的数据中心内部,同一机架下机器间的网络带宽可以达到网卡带宽,延迟在0.3ms以内,但是在经过汇聚交换机(PSW)后,机器间的网络带宽会缩小到原来的1/3,同时延时会接近0.5ms。而在存储系统跨地域部署时,不同地域的网络一般都有流量限制,带宽更小。同时由于传输距离的增长,导致传输延迟呈现正比关系的增加。
相关技术对所有数据采用相同的分布策略,没有考虑不同数据的差异性。例如,有些数据对可用性要求很高,数据量不大,而有些数据没有很高的可用性要求,但数据量大,读写吞吐量很高。采用相同的分布策略,对于可用性要求高的数据可能满足不了防御大范围故障的要求,而对于可用性要求低的数据,却不能满足其对数据读写速度的要求,还会给网络带来沉重的负担。
此外,相关技术采用单一层次的容错域划分,如均按照机架划分,很难表现出不同层次容错域间的区别,给数据分布的合理性和有效性造成困扰。例如,由于网络的分层架构,两个机架之间的带宽并不一定都是一样的,可能要经过核心交换机甚至经过互联网,一旦数据分布到的两个机架之间带宽较小,会造成数据写变慢。为了弥补这样的问题,一种做法是调整网络架构,使得系统中任意两个节点间的带宽是一样的,但网络设备和架构调整的代价相对较大,也提高了机房内部网络布线的难度,降低了网络可以承载的规模,不能做到成本降低的目的。
发明内容
有鉴于此,本发明实施例提供了一种分布式存储系统的数据分布控制方法,包括:
从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,所述多种分布策略包括跨容错域分布的策略和在一个容错域内分布的策略;
根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入。
本发明实施例还提供了一种分布式存储系统中的数据分布控制系统,包括策略确定模块和分配及写入模块,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710036337.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置