[发明专利]一种面向Namenode的高效元数据构建和RPC性能提升的方法和装置有效
申请号: | 202010722288.9 | 申请日: | 2020-07-24 |
公开(公告)号: | CN112241365B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 马秉楠;惠榛;郭舒;沈时军;李春程;刘德朋;贾思宇;王振宇;李斌斌;王树鹏 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;中国科学院信息工程研究所 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/182;G06F9/54 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 namenode 高效 数据 构建 rpc 性能 提升 方法 装置 | ||
本发明涉及一种面向Namenode的高效元数据构建和RPC性能提升的方法和装置。该方法通过性能测试工具中的创建文件功能构造文件对象,通过在内存中虚拟出的仅有基本结构的Datanode节点构造文件块对象,由文件对象和文件块对象构成Namenode内存元数据;基于构建的元数据,构造与生产环境相符的Namenode负载状态,并进行Namenode内部扩展和集群扩展,实现RPC性能优化。本发明能够高速构建Namenode元数据,为快速搭建接近生产环境的测试集群提供了帮助,全局锁的拆分能够提升RPC性能,多个Namenode协作管理集群且同时对外提供服务,提供了更高的读写吞吐量。
技术领域
本发明属于大数据技术领域,具体提出一种面向Namenode(管理节点)的高效元数据构建和RPC(Remote Procedure Call,远程过程调用)性能提升的方法和装置。
背景技术
随着计算机存储能力的提升和复杂算法的发展,近年来的数据量成指数型增长,这些趋势使科学技术发展也日新月异,商业模式发生了颠覆式变化。
Hadoop是Apache软件基金会下的开源分布式计算平台,实现在大量计算机组成的集群中对海量数据进行分布式计算,为大数据的分布式存储和计算提供了有效支撑。HDFS是Hadoop的核心组件之一,实现海量数据的分布式存储。HDFS架构采用主从架构(master/slave)。一个典型的HDFS集群包含一个NameNode节点(管理节点)和多个DataNode节点(工作节点)。NameNode节点负责整个HDFS文件系统中的文件的元数据的保管和管理;DataNode负责存储客户端(Client)发来的数据块(Block),执行数据块的读写操作。在此架构设计中HDFS的性能主要取决于Namenode的RPC性能。因此能够快速地构建Namenode的内存元数据以接近真实线上环境、测试Namenode的性能以及RPC性能的优化是提升HDFS性能的关键。
发明内容
本发明的目的是提出一种高效构建Namenode元数据和提升HDFS性能的方法,以支撑大规模集群的测试和扩展。
为实现上述目的,本发明采用的技术方案如下:
一种面向Namenode节点的高效元数据构建方法,包括以下步骤:
通过性能测试工具中的创建文件功能构造文件对象;
在内存中虚拟出仅有基本结构的Datanode节点,通过虚拟的Datanode节点构造文件块对象;
由构造的文件对象和文件块对象,构成Namenode内存元数据。
进一步地,所述虚拟的Datanode节点的字段包含:名称空间信息、Datanode注册信息、块信息列表。
进一步地,所述通过虚拟的Datanode节点构造文件块对象,包括:
在内存中初始化一定数量的TinyDatanode对象,并注册到Namenode中;其中TinyDataNode表示内存中虚拟出来的仅有基本结构的Datanode;
通过HDFS的客户端协议请求Namenode进行块创建,同时将favoredNodes参数设定为初始化的TinyDatanode;
以多线程的方式执行上述逻辑,完成虚拟块的创建。
一种HDFS的RPC性能提升方法,包括以下步骤:
基于本发明方法构建的元数据,构造与生产环境相符的Namenode负载状态;
基于与生产环境相符的Namenode负载状态,进行Namenode内部扩展和集群扩展,实现RPC性能优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院信息工程研究所,未经国家计算机网络与信息安全管理中心;中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010722288.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置