[发明专利]一种数据存储方法、装置、设备及介质在审

专利信息
申请号: 202210832806.1 申请日: 2022-07-15
公开(公告)号: CN115118761A 公开(公告)日: 2022-09-27
发明(设计)人: 高矗;李选 申请(专利权)人: 济南浪潮数据技术有限公司
主分类号: H04L67/141 分类号: H04L67/141;H04L67/1097;H04L67/06;G06F3/06;G06F16/182
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 刘松
地址: 250101 山东省济南市自由贸易试验区*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 存储 方法 装置 设备 介质
【说明书】:

本申请公开了一种数据存储方法、装置、设备及介质,涉及计算机技术领域,包括:通过客户端向分布式文件系统中的名称节点发送文件上传请求,并通过名称节点确定各数据节点;向各数据节点发起连接建立请求,并在接收到各数据节点基于允许连接返回的应答消息后,与各数据节点建立通信管道;对大数据文件进行分片,得到若干数量的数据块;通过通信管道,将若干数量的数据块依次分配至各数据节点,然后将若干数量的数据块中当前未被分配的数据块,分配至当前已完成传输的数据节点直至若干数量的数据块均被存储至相应的数据节点。可见,本申请通过增加与数据节点的连接数量达到提高传输效率、提高数据传输稳定性以及资源合理利用的效果。

技术领域

发明涉及计算机技术领域,特别涉及一种数据存储方法、装置、设备及介质。

背景技术

随着数据量越来越大,同一个操作系统中无法存下所有的数据,因此需要将数据分配到更多的操作系统管理的磁盘中,但是这样不方便管理和维护,由此需要一种系统来管理多台机器上的文件,也即分布式文件管理系统,HDFS(Hadoop Distributed FileSystem,分布式文件系统)是分布式文件管理系统中的一种,由很多服务器联合起来实现其功能,用于存储文件,并通过目录树来定位文件。

参见图1所示,当前HDFS流式数据存储的步骤如下:(1)客户端向名称节点(NN,Name Node)发送文件上传请求;(2)NN节点收到请求后,执行各种检查确定该文件是否存在以及客户端是否有权限操作,如果均有,则向客户端返回可以上传的指令;(3)客户端收到指令后,向NN节点发起DN(DN,Data Node)节点下发请求(4)NN节点根据副本参数和机架感知计算出上传的DN节点,并告知给客户端;(5)客户端根据返回的DN节点进行数据上传,首先与第一个DN节点建立通信管道,然后第一个DN节点调用第二个DN节点,第二个DN节点调用第三个DN节点,直到将整个通信建立完成;(6)DN1、DN2、DN3逐级应答客户端,通信管道建立完成;(7)客户端向DN1上传第一个block(数据块),(先从磁盘读取数据放到一个本地内存缓存),以packet为单位,DN1收到一个packet就会传给DN2,DN2传给DN3;其中,该数据块为对文件进行切分后得到的数据块;(8)当第一个block传输完成后,客户端再次请求上传第二个block,直到文件的全部block上传成功。上述过程缺陷是:数据按照block流式存储,受限于网络带宽、网络时延,以及断连后需要选择新的DN节点重新上传;其次,block上传至DN节点后处理受限于DN节点的资源使用,当此DN节点处理其他紧急事务,资源利用率过高会导致数据处理缓慢;最后,DN1接收数据后传给DN2,DN2传给DN3,使得DN2、DN3的资源得不到有效利用。

为此,如何提高传输效率、提高数据传输稳定性以及实现资源合理利用是本领域亟待解决的问题。

发明内容

有鉴于此,本发明的目的在于提供一种数据存储方法、装置、设备及介质。能够提高传输效率、提高数据传输稳定性以及实现资源合理利用,其具体方案如下:

第一方面,本申请公开了一种数据存储方法,包括:

通过客户端向分布式文件系统中的名称节点发送文件上传请求,并通过所述名称节点确定各数据节点;

向所述各数据节点发起连接建立请求,并在接收到所述各数据节点基于允许连接返回的应答消息后,与所述各数据节点建立通信管道;

对大数据文件进行分片,得到若干数量的数据块,其中,每个所述数据块包括所述大数据文件的文件标识以及分片偏移量;

通过所述通信管道,将所述若干数量的数据块依次分配至所述各数据节点,然后将所述若干数量的数据块中当前未被分配的数据块,分配至当前已完成传输的数据节点直至所述若干数量的数据块均被存储至相应的数据节点,以便通过所述各数据节点完成对所述若干数量的数据块的传输。

可选的,所述通过所述名称节点确定各数据节点,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210832806.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top