[发明专利]一种部署Namenode的方法和系统在审

专利信息
申请号: 201711099119.9 申请日: 2017-11-09
公开(公告)号: CN107870770A 公开(公告)日: 2018-04-03
发明(设计)人: 欧阳涛 申请(专利权)人: 上海斐讯数据通信技术有限公司
主分类号: G06F8/61 分类号: G06F8/61
代理公司: 上海硕力知识产权代理事务所(普通合伙)31251 代理人: 郭桂峰
地址: 201616 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 部署 namenode 方法 系统
【说明书】:

技术领域

发明实施例涉及计算机领域,尤其涉及一种部署命名节点(Namenode)的方法和系统。

背景技术

爱姆鲍蕾(Ambari)是一种基于Web的工具,支持阿帕奇(Apache)海杜普(Hadoop)集群的供应、管理和监控。Ambari目前已支持大多数海杜普(Hadoop)组件,包括Hadoop分布式文件系统(HDFS)、MapReduce、Hive、Pig、Hbase、Zookeper、Sqoop和Hcatalog等。

Hadoop由许多元素构成,其最底部是Hadoop Distributed File System(HDFS),它存储Hadoop集群中所有存储节点上的文件。HDFS的上一层是MapReduce引擎,该引擎由JobTrackers和TaskTrackers组成。通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具(Hive)和分布式数据库(Hbase)的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。

对外部客户机而言,HDFS就像一个传统的分级文件系统,可以创建、删除、移动或重命名文件,等等。但是HDFS的架构是基于一组特定的节点构建的,这些节点包括命名节点NameNode(仅一个),它在HDFS内部提供元数据服务;数据节点DataNode,它为HDFS提供存储块。存储在HDFS中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。

命名节点(NameNode)管理文件系统的命名空间,它维护着文件系统树及整棵树内所有的文件和目录。NameNode负责管理文件系统名称空间和控制外部客户机的访问。NameNode决定是否将文件映射到DataNode上的复制块上。当外部客户机发送请求要求创建文件时,NameNode会以块标识和该块的第一个副本的DataNode IP地址作为响应。这个NameNode还会通知其他将要接收该块的副本的DataNode。

DataNode也是一个通常在HDFS实例中的单独机器上运行的软件,Hadoop集群包含一个NameNode和大量DataNode。DataNode通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。DataNode响应来自HDFS客户机的读写请求。DataNode还响应来自NameNode的创建、删除和复制块的命令。

HDFS集群有两类节点,并以管理者-工作者模式运行,即一个NameNode为管理者和多个数据节点(DataNode)为工作者。一个HDFS cluster包含一个NameNode和若干的DataNode,NameNode(NN)是master,主要负责管理HDFS文件系统,具体地包括namespace管理(其实就是目录结构)和block管理。DataNode(DN)主要是用来存储数据文件,HDFS将一个文件分割成一个个的块(block),这些block可能存储在一个DataNode上或者是多个DataNode上。DN负责实际的底层的文件的读写,如果客户端(client)程序发起了读HDFS上的文件的命令,那么首先将这些文件分成block,然后NN将告知client这些block数据是存储在哪些DN上的,之后,client将直接和DN交互。

在大数据应用场景下,随着数据海量增加,利用Ambari部署已经成为主流的解决方案,但由于Ambari部署面临Linux环境复杂、Namenode HA配置不够自动化和一体化,导致HA的部署困难和安全低下。

发明内容

本发明多个方面提供一种部署Namenode的方法和系统,可以改进Ambari部署Namenode HA的效率低与安全低的问题,快速提高Hadoop集群部署的效率。

本发明的一方面提供一种部署Namenode的方法,包括:

具有linux系统的主机器和辅机器安装Hadoop组件的安装包;

所述主机器安装Namenode,管理所述Namenode相关服务的测试和连接,配置所述Namenode对外的地址与域名

所述辅机器安装包含HDFS的DataNode,并配置所述包含HDFS的所述DataNode与所述Namenode连接。

可选地,所述主机器和所述辅机器的磁盘根目录大于或等于40G bit。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斐讯数据通信技术有限公司,未经上海斐讯数据通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711099119.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top