首页 / HADOOP / Hadoop2.x的HA介绍

Hadoop2.x的HA介绍

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop2.x的HA介绍，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3387字，纯文字阅读大概需要5分钟。

内容图文

这篇文章主要介绍的是Hadoop2.0的HA(High Avalability 高可用性)，在介绍hadoop2.0的HA配置之前，本文先介绍hadoop2.0 HA的基本原理和2种方式。

1.概述

在Hadoop2.0之前，NameNode只有一个，存在单点问题(虽然Hadoop1.0有SecondaryNameNode，checkPointNode、buckcupnode这些，但是单点问题依然存在)，在hadoop2.0引入了HA机制。Hadoop2.0的HA机制官方介绍了有2种方式，一种是NFS(Net Work File System)方式，另外一种是QJM(Quorum Journal Manager)方式。

2.基本原理

Hadoop2.0的HA机制有两个NameNode，一个是active NameNode，状态是active；另外一个是standby NameNode，状态是standby。两者的状态是可以切换的，但不能同时都是active状态，最多只有1个是active状态。只有active NameNode提供对外的服务，standby NameNode是不对外服务的。active NameNode和standby NameNode之间通过NFS或者JN(journalnode QJM方式)来同步。

active NameNode会把最近的操作记录写到本地一个edits文件中(edits file)，并传输到NFS或者JN中。standby NameNode定期检查，从NFS或者JN把最近的edits文件读过来，然后把edits文件和fsimage文件合并成一个新的fsimage，合并之后会通知active NameNode获取这个新的fsimage。active NameNode获得这个新的fsimage文件之后，替换原来旧的fsimage文件。

这样，就保持了active NameNode和standby NameNode的数据的实时同步，standby NameNode可以随时切换成active NameNode(比如active NameNode挂了)。而且还有一个原来hadoop1.0的SecondaryNameNode，checkpoint，buckcupnode的功能；合并edits文件和fsimage，使fsimage文件一直保持更新。所以启动了hadoop2.0的HA机制之后，SecondaryNameNode，checkpointnode，buckcupnode这些都不需要了。

3.NFS方式

NFS作为active NameNode和standby NameNode之间数据共享的存储。active NameNode会把最近的edits文件写到NFS，而standby NameNode从NFS中把数据读过来。这个方式的缺点是，如果active NameNode或者standby NameNode有一个和NFS之间网络有问题的话，则会造成他们之前数据的同步出问题。

Hadoop2.x的HA介绍 - 文章图片

4.QJM(Quorum Journal Manager)方式

QJM的方式可以解决上述NFS容错机制不足的问题。active NameNode和standby NameNode之间是通过一组journalNode(数量是奇数，可以是3,5,7,...2n+1)来共享数据。active NameNode把最近的edits文件写到2n+1个journalnode上，只要有n+1个写入成功的话就表示写入操作成功了，然后standby NameNode就可以从journalnode上读取了。可以看到，QJM方式由容错机制，可以容忍n个journalNode的失败。

Hadoop2.x的HA介绍 - 文章图片

5.主备节点的切换

active NameNode和standby NameNode可以随时切换。当active NameNode挂掉后，也可以把standby NameNode切换成active状态，称为active NameNode。可以人工切换和自动切换。人工切换时通过执行HA管理的命令来改变NameNode的状态，从standby到active，或者从active到standby。自动切换则在active NameNode挂掉的时候，standby NameNode自动切换成active状态，取代原来的active NameNode称为新的active NameNode，HDFS继续正常工作。

主备节点的自动切换需要配置Zookeeper。active NameNode和standby NameNode把他们的状态实时记录到Zookeeper中，Zookeeper监视他们的状态变化。当Zookeeper发现active NameNode挂掉后，会自动把standby NameNode切换成active NameNode。

Hadoop2.x的HA介绍 - 文章图片

6.实战tips

1)：QJM方式有明显的优点，一是本身就有fencing的功能，而是通过多个journal节点增强了系统的健壮性，所以建议在生产环境中采用QJM的方式。

2)：journalnode消耗的资源很少，不需要额外的机器专门来启动journalnode，可以从hadoop集群中选几台机器作为journalnode。

原文来自：http://www.linuxidc.com/Linux/2014-05/101174.htm

内容总结

以上是互联网集市为您收集整理的Hadoop2.x的HA介绍全部内容，希望文章能够帮你解决Hadoop2.x的HA介绍所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/531893.html

来源：【匿名】

【上一篇】Zookeeper3.4.6在Hadoop2.2.0的安装【下一篇】php能用hadoop吗

更多 ►

【Hadoop2.x的HA介绍】教程文章相关的互联网学习教程文章

hadoop2.x常用端口

组件节点默认端口配置用途说明HDFSDataNode50010dfs.datanode.addressdatanode服务端口，用于数据传输HDFSDataNode50075dfs.datanode.http.addresshttp服务的端口HDFSDataNode50475dfs.datanode.https.addresshttps服务的端口HDFSDataNode50020dfs.datanode.ipc.addressipc服务的端口HDFSNameNode50070dfs.namenode.http-addresshttp服务的端口HDFSNameNode50470dfs.namenode.https-addresshttps服务的端口HDFSNameNode8020fs.defa...

hadoop 2.7.2 (hadoop2.x)使用ant制作eclipse插件hadoop-eclipse-plugin-2.7.2.jar【图】

之前介绍了我在Ubuntu下组合虚拟机Centos6.4搭建hadoop2.7.2集群,为了做mapreduce开发,要使用eclipse,并且需要对应的hadoop插件hadoop-eclipse-plugin-2.7.2.jar,首先说明一下,在hadoop1.x之前官方hadoop安装包中都自带有eclipse的插件,而如今随着程序员的开发工具eclipse版本的增多和差异,hadoop插件也必须要和开发工具匹配,hadoop的插件包也不可能全部兼容.为了简化,如今的hadoop安装包内不会含有eclipse的插件.需要各自根据自己...

Hadoop2.x安装启动错误

Hadoop2安装笔记可以参看：http://www.geedoo.info/hadoop2-development-environment-to-build-test.html 这里主要记录下hadoop安装和测试过程遇到的问题记录： 1.问题一安装配置完成后执行start-dfs.sh出现如下异常： sed: -e expression #1, char 6: unknHadoop2安装笔记可以参看：http://www.geedoo.info/hadoop2-development-environment-to-build-test.html 这里主要记录下hadoop安装和测试过程遇到的问题记录： 1.问题一安...

Hadoop2.x在Ubuntu系统中编译源码

本文主要记录Hadoop2.x在Ubuntu 12.04下编译源码的主要步骤和注意点：［一］、基础环境 Ubuntu 12.04 LTS 64? 位 Hadoop2.2.0 Java version: 1.7.0_55 Apache Maven 3.2.1 ［二］、软件配置 1、更新apt 源 vi /et/apt/sources.list ,在文件末增加如下国内访本文主要记录Hadoop2.x在Ubuntu 12.04下编译源码的主要步骤和注意点：［一］、基础环境 Ubuntu 12.04 LTS 64? 位Hadoop2.2.0Java version: 1.7.0_55Apache Maven 3.2.1［二...

[原创]Hadoop2.x的DistributedCache无法工作的问题

转载请注明出处： http://www.codelast.com/ 现象：和这个帖子描述的一样，简单说来就是，在Hadoop 2.x上，用新的DistributedCache的API，在mapper中会获取不到这个cache文件。下面就详细地描述一下新旧API的用法区别以及解决办法。『1』旧API 将HDFS文转载请注明出处：http://www.codelast.com/ 现象：和这个帖子描述的一样，简单说来就是，在Hadoop 2.x上，用新的DistributedCache的API，在mapper中会获取不到这个cache文件...

eclipse中开发Hadoop2.x的Map/Reduce项目【图】

本文演示如何在Eclipse中开发一个Map/Reduce项目： 1、环境说明 Hadoop2.2.0 Eclipse?Juno SR2 Hadoop2.x-eclipse-plugin 插件的编译安装配置的过程参考：http://www.micmiu.com/bigdata/hadoop/hadoop2-x-eclipse-plugin-build-install/ 2、新建MR工程依次本文演示如何在Eclipse中开发一个Map/Reduce项目： 1、环境说明 Hadoop2.2.0Eclipse?Juno SR2Hadoop2.x-eclipse-plugin 插件的编译安装配置的过程参考：http://www.micmiu.c...

Hadoop2.x的HA介绍【图】

这篇文章主要介绍的是Hadoop2.0的HA(High Avalability 高可用性)，在介绍hadoop2.0的HA配置之前，本文先介绍hadoop2.0 HA的基本原理和2种方式。 1.概述在Hadoop2.0之前，NameNode只有一个，存在单点问题(虽然Hadoop1.0有SecondaryNameNode，checkPointNode这篇文章主要介绍的是Hadoop2.0的HA(High Avalability 高可用性)，在介绍hadoop2.0的HA配置之前，本文先介绍hadoop2.0 HA的基本原理和2种方式。 1.概述在Hadoop2.0之前，Nam...

hadoop2.x常用端口、定义方法及默认端口、hadoop1.X端口对比

问题导读： 1.DataNode的http服务的端口、ipc服务的端口分别是哪个？ 2.NameNode的http服务的端口、ipc服务的端口分别是哪个？ 3.journalnode的http服务的端口、ipc服务的端口分别是哪个？ 4.ResourceManager的http服务端口是哪个？ 5.NodeManager的http服务问题导读： 1.DataNode的http服务的端口、ipc服务的端口分别是哪个？ 2.NameNode的http服务的端口、ipc服务的端口分别是哪个？ 3.journalnode的http服务的端口、ipc服务的端...

Hadoop2.x介绍与源码编译

进入安装目录 /opt/modules/apache-maven-3.0.5/conf ，编辑 settings.xml 文件 * 修改 mirrors 内容： mirror idnexus-osc/id mirrorOf*/mirrorOf nameNexusosc/name urlhttp://maven.oschina.net/content/groups/public//url /mirror * 修改 profiles 内容进入安装目录 /opt/modules/apache-maven-3.0.5/conf，编辑 settings.xml 文件* 修改内容：nexus-osc * Nexus osc http://maven.oschina.net/content/groups/public/...

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook 使用 Oracle Load For Hadoop（OLH）实...Hadoop基础知识 windows部署hadoop-2.7.0 你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop2.x的HA介绍

Hadoop2.x的HA介绍

内容导读

内容图文

1.概述

2.基本原理

3.NFS方式

4.QJM(Quorum Journal Manager)方式

5.主备节点的切换

6.实战tips

内容总结

内容备注

内容手机端

【Hadoop2.x的HA介绍】教程文章相关的互联网学习教程文章

HADOOP - 最新教程

HADOOP - 最热教程