[发明专利]一种部署Namenode的方法和系统在审

申请号：	201711099119.9	申请日：	2017-11-09
公开（公告）号：	CN107870770A	公开（公告）日：	2018-04-03
发明（设计）人：	欧阳涛	申请（专利权）人：	上海斐讯数据通信技术有限公司
主分类号：	G06F8/61	分类号：	G06F8/61
代理公司：	上海硕力知识产权代理事务所(普通合伙)31251	代理人：	郭桂峰
地址：	201616 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种部署 namenode 方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明实施例涉及计算机领域，尤其涉及一种部署命名节点(Namenode)的方法和系统。

背景技术

爱姆鲍蕾(Ambari)是一种基于Web的工具，支持阿帕奇(Apache)海杜普(Hadoop)集群的供应、管理和监控。Ambari目前已支持大多数海杜普(Hadoop)组件，包括Hadoop分布式文件系统(HDFS)、MapReduce、Hive、Pig、Hbase、Zookeper、Sqoop和Hcatalog等。

Hadoop由许多元素构成，其最底部是Hadoop Distributed File System(HDFS)，它存储Hadoop集群中所有存储节点上的文件。HDFS的上一层是MapReduce引擎，该引擎由JobTrackers和TaskTrackers组成。通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具(Hive)和分布式数据库(Hbase)的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。

对外部客户机而言，HDFS就像一个传统的分级文件系统，可以创建、删除、移动或重命名文件，等等。但是HDFS的架构是基于一组特定的节点构建的，这些节点包括命名节点NameNode(仅一个)，它在HDFS内部提供元数据服务；数据节点DataNode，它为HDFS提供存储块。存储在HDFS中的文件被分成块，然后将这些块复制到多个计算机中(DataNode)。

命名节点(NameNode)管理文件系统的命名空间，它维护着文件系统树及整棵树内所有的文件和目录。NameNode负责管理文件系统名称空间和控制外部客户机的访问。NameNode决定是否将文件映射到DataNode上的复制块上。当外部客户机发送请求要求创建文件时，NameNode会以块标识和该块的第一个副本的DataNode IP地址作为响应。这个NameNode还会通知其他将要接收该块的副本的DataNode。

DataNode也是一个通常在HDFS实例中的单独机器上运行的软件，Hadoop集群包含一个NameNode和大量DataNode。DataNode通常以机架的形式组织，机架通过一个交换机将所有系统连接起来。DataNode响应来自HDFS客户机的读写请求。DataNode还响应来自NameNode的创建、删除和复制块的命令。

HDFS集群有两类节点，并以管理者-工作者模式运行，即一个NameNode为管理者和多个数据节点(DataNode)为工作者。一个HDFS cluster包含一个NameNode和若干的DataNode，NameNode(NN)是master，主要负责管理HDFS文件系统，具体地包括namespace管理(其实就是目录结构)和block管理。DataNode(DN)主要是用来存储数据文件，HDFS将一个文件分割成一个个的块(block)，这些block可能存储在一个DataNode上或者是多个DataNode上。DN负责实际的底层的文件的读写，如果客户端(client)程序发起了读HDFS上的文件的命令，那么首先将这些文件分成block，然后NN将告知client这些block数据是存储在哪些DN上的，之后，client将直接和DN交互。

在大数据应用场景下，随着数据海量增加，利用Ambari部署已经成为主流的解决方案，但由于Ambari部署面临Linux环境复杂、Namenode HA配置不够自动化和一体化，导致HA的部署困难和安全低下。

发明内容

本发明多个方面提供一种部署Namenode的方法和系统，可以改进Ambari部署Namenode HA的效率低与安全低的问题，快速提高Hadoop集群部署的效率。

本发明的一方面提供一种部署Namenode的方法，包括：

具有linux系统的主机器和辅机器安装Hadoop组件的安装包；

所述主机器安装Namenode，管理所述Namenode相关服务的测试和连接，配置所述Namenode对外的地址与域名；

所述辅机器安装包含HDFS的DataNode，并配置所述包含HDFS的所述DataNode与所述Namenode连接。

可选地，所述主机器和所述辅机器的磁盘根目录大于或等于40G bit。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海斐讯数据通信技术有限公司，未经上海斐讯数据通信技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711099119.9/2.html，转载请声明来源钻瓜专利网。