Hadoop集群(高可用)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop集群(高可用)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5621字，纯文字阅读大概需要9分钟。

内容图文

分布式搭建入口:https://www.cnblogs.com/Hephaestus/p/12213719.html
集群规划:

	namenode	datanode	journalnode
hadoop100	是(nn2)
hadoop101	是(nn1)	是	是
hadoop102		是	是
hadoop103		是	是

1. 简介

高可用程序的类型
主从方式(冷备)
两个相同的应用程序,一个对外提供服务,成为主程序,另一个平时不运行为备程序,就是一个主程序的备份,一旦主程序出现问题,备份提供恢复操作
双主互备(热备)
两个相同的应用程序,同时对外提供服务(两个程序相互为对方备份的存在,双主热备),当启动一个出现问题时,另一个可以对外提供服务,不会造成服务器宕机

2. 配置(在之前搭建分布式集群的基础上)

修改配置文件

修改核心配置文件: vim etc/hadoop/core-site.xml
加入

        <configuration>

        <!-- 指定HDFS中NameNode的地址 -->
        <property>
                <name>fs.defaultFS</name>
                <!--hdfs://hadoop101:9000-->
                <value>hdfs://mycluster</value>
        </property>

        <!-- 指定Hadoop运行时产生文件的存储目录 -->
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/soft/module/hadoop-2.9.2/data/tmp</value>
        </property>

</configuration>

修改hdfs配置文件: vim etc/hadoop/hdfs-site.xml
加入

        <configuration>

        <!--HA高可用配置-->
        <!--集群起名-->
        <property>
                <name>dfs.nameservices</name>
                <value>mycluster</value>
        </property>

        <!--指定mycluster的有哪些namenode，nn1,nn2 自己去的名-->
        <property>
                <name>dfs.ha.namenodes.mycluster</name>
                <value>nn1,nn2</value>
        </property>

        <!--nn1 RPC端口 -->
        <property>
                <name>dfs.namenode.rpc-address.mycluster.nn1</name>
                <value>hadoop101:9000</value>
        </property>

        <!--nn1 HTTP端口 -->
        <property>
                <name>dfs.namenode.http-address.mycluster.nn1</name>
                <value>hadoop101:50070</value>
        </property>

        <!--nn2 RPC端口 -->
        <property>
                <name>dfs.namenode.rpc-address.mycluster.nn2</name>
                <value>hadoop100:9000</value>
        </property>

        <!--nn2 HTTP端口 -->
        <property>
                <name>dfs.namenode.http-address.mycluster.nn2</name>
                <value>hadoop100:50070</value>
        </property>

        <!--HA故障切换 -->
        <!-- 当namnode故障，是否自动启动另一个namenode(默认值为false)-->
        <property>
                <name>dfs.ha.automatic-failover.enabled </name>
                <value>false</value>
        </property>

        <!-- journalnode 配置 -->
        <!-- mycluster的两个namenode共享editsa文件目录时，使用journalnode集群信息-->
        <property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://hadoop101:8485;hadoop102:8485;hadoop103:8485/mycluster</value>
        </property>

        <!--当mycluster故障时，哪个实现类负责故障切换-->
        <property>
                <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://hadoop101:8485;hadoop102:8485;hadoop103:8485/mycluster</value>
        </property>

        <!--当mycluster故障时，哪个实现类负责故障切换-->
        <property>
                <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>

        <!--发生failover时，Standby的节点要执行一系列方法把原来那个Active节点中不健康的NameNode服务给杀掉，
                这个叫做fence过程。sshfence会通过ssh远程调用fuser命令去找到Active节点的NameNode服务并杀死它-->
         <!-- 配置隔离机制方法，多个机制用换行分割，即每个机制暂用一行 -->
        <property>
                <name>dfs.ha.fencing.methods</name>
                <value>sshfence</value>
         </property>

        <!--SSH私钥 使用sshfence隔离机制时需要ssh免登陆-->
        <property>
                <name>dfs.ha.fencing.ssh.private-key-files</name><!--免密登录密钥位置-->
                <!--<value>/home/hadoop/.ssh/id_rsa</value>-->
                <value>/home/banana/.ssh/id_rsa</value>
        </property>

        <!--SSH超时时间 -->
        <property>
                <name>dfs.ha.fencing.ssh.connect-timeout</name>
                <value>30000</value>
        </property>

        <!--Journal Node文件存储地址 -->
        <property>
                 <name>dfs.journalnode.edits.dir</name>
                <value>/soft/module/hadoop-2.9.2/data/tmp/journal</value>
        </property>

</configuration>

修改从机配置文件: vim etc/hadoop/slaves

        hadoop101
hadoop102
hadoop103

分发配置文件 xsync.sh etc/hadoop/

3. 启动集群

启动journalnode集群
将journalnode部署在DataNode节点上在DataNode节点执行 ./sbin/hadoop-daemon.sh start journalnode
格式化namenode(一定要在journalnode集群启动后再进行格式化)
(1) 先删除所有节点上的 tmp dfs/name dfs/data logs 等目录
(2) 在nn1(namenode1)上执行 hdfs namenode –format
(3) 在hadoop101(nn1上)启动namenode hadoop-daemon.sh start namenode
namenode2同步namenode1上格式化后的信息(先启动nn1的namenode)
在nn2(namenode2)上执行 hdfs namenode -bootstrapStandby
在namenode1启动集群 sbin/start-dfs.sh

4. 激活namenode

执行完前面的步骤后此时namenode1和namenode2都是standby状态（通过web服务查看），还不能正常提供服务，需要将将其中一个节点切换到active状态。
将namenode1切换为active状态
在namennode1执行 ./bin/hdfs haadmin -failover --forceactive nn2 nn1(这里nn2, nn1表示namenode的服务名，需要与hdfs-sit.xml中的配置保持一致。)然后查看namenode1和namenode2的状态

5. HA手动切换

在active状态的namenode执行 kill -9 xxx(进程id)
切换namenode
在namenode2上切换为active ./bin/hdfs haadmin -failover --forceactive nn1 nn2(执行后日志会报错，是因为jar包版本的原因，不影响切换状态。)

附:自己出的小问题

8.8.8.101:8485: Call From hadoop101/8.8.8.101 to hadoop101:8485 failed on connection exception: java.net.ConnectException: 拒绝连接; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused
问题:未启动journal集群(./sbin/hadoop-daemon.sh start journalnode)

Unable to fetch namespace information from active NN at hadoop101/8.8.8.101:9000: Call From hadoop100/8.8.8.100 to hadoop101:9000 failed on connection exception: java.net.ConnectException: 拒绝连接; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused
问题:未启启动主机器的namenode:(./hadoop-daemon.sh start namenode)

对于拒绝连接问题:如果你的所有配置都是正确的，那么这个问题只能是host,network，firewall(当然还有你输命令的问题)

原文：https://www.cnblogs.com/Hephaestus/p/12420370.html

内容总结

以上是互联网集市为您收集整理的Hadoop集群(高可用)全部内容，希望文章能够帮你解决Hadoop集群(高可用)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1076827.html

来源：【匿名】

【上一篇】Hadoop源码编译与调试汇总【下一篇】php能用hadoop吗

更多 ►

【Hadoop集群(高可用)】教程文章相关的互联网学习教程文章

core-site.xml 配置<configuration>?<property>?<name>fs.defaultFS</name> ? <value>hdfs://mycluster</value>? </property>?<property> ? <name>hadoop.tmp.dir</name> ? <value>/usr/local/hadoop-2.5.1/tmp</value> ?</property>?<property> ? <name>hadoop.http.staticuser.user</name> ? <value>root</value> ?</property>?<property> ? <name>ha.ZooKeeper.quorum</name>?<value>masternode...

Hadoop2.x搭建HA(高可用)机制的集群【图】

之前有朋友问如何搭建一个更为稳定、数据更为安全、执行效率更高的Hadoop集群，其实搭建一个HA机制的集群就能满足这些需求。所以就以前的工作上的一些经验和总结来和大家介绍一下什么是高可用的Hadoop集群，以及如何把这个高可用的Hadoop集群搭建起来1、什么是HA机制 1.1、Hadoop-HA集群运作机制介绍　　　　所谓HA，即高可用（7*24小时不中断服务）实现高可用最关键的是消除单点故障，Hadoop-ha严格来说应该分成各个组件的HA机制...

ubuntu18.04.2 hadoop3.1.2+zookeeper3.5.5高可用完全分布式集群搭建【代码】【图】

ubuntu18.04.2 hadoop3.1.2+zookeeper3.5.5高可用完全分布式集群搭建集群规划：hostnameNameNodeDataNodeJournalNodeResourceManagerZookeepernode01√√√node02√√node03√√√√node04√√√node05√√√准备工作:首先克隆5台ubuntu虚拟机vim /etc/netplan/01-network-manager-all.yaml修改网络配置我的5台网络配置如下： (ps: 由于这次是家里台式, 所以网关和之前笔记本搭的那次不一样)# Let NetworkManager manage all devic...

高可用Hadoop平台－Oozie工作流【代码】【图】

1.概述　　在开发Hadoop的相关应用使用，在业务不复杂，任务不多的情况下，我们可以直接使用Crontab去完成相关应用的调度。今天给大家介绍的是统一管理各种调度任务的系统，下面为今天分享的内容目录：内容介绍Oozie Server截图预览　　下面开始今天的内容分享。2.内容介绍　　今天的内容不涉及Oozie的具体细节操作，它的工作流程在下一篇博客为大家详细介绍。今天主要给大家分享Oozie的作用，它的集成步骤等内容。2.1 作用　　Ooz...

hadoop+zookepper实现namenode的高可用

Hadoop+zookeepker安装与配置: 在hadoop-env.sh中添加export JAVA的环境变量修改hostname文件的名称，/etc/hosts文件配置主机名和ip的映射关系，将mstaer，slave的主机名和ip地址都添加进来配置ssh免密钥配置Ssh-keygen –t rsa在./.ssh文件中生成两个文件id_rsa（私钥），id_rsa.pub(公钥)cat id_rsa.pub > .ssh/authorized_keysscp authorized_keys user@ipaddress:/home/user/id_rsa.pub修改authorzed文件的权限为600 //Namen...

Hadoop集群(高可用)【代码】

分布式搭建入口:https://www.cnblogs.com/Hephaestus/p/12213719.html 集群规划:namenodedatanodejournalnodehadoop100是(nn2)hadoop101是(nn1)是是hadoop102是是hadoop103是是1. 简介高可用程序的类型主从方式(冷备) 两个相同的应用程序,一个对外提供服务,成为主程序,另一个平时不运行为备程序,就是一个主程序的备份,一旦主程序出现问题,备份提供恢复操作双主互备(热备) 两个相同的应用程序,同时对外提供服务(两个程序相互为对方...

安装高可用Hadoop生态（二）安装Zookeeper【代码】

2. 安装Zookeeper2.1. 解压程序※ 3台服务器分别执行tar -xf ~/install/zookeeper-3.4.9.tar.gz -C/opt/cloud/packagesln -s /opt/cloud/packages/zookeeper-3.4.9 /opt/cloud/bin/zookeeper ln -s /opt/cloud/packages/zookeeper-3.4.9/conf /opt/cloud/etc/zookeepermkdir -p /opt/cloud/data/zookeeper/dat mkdir -p /opt/cloud/data/zookeeper/logdat mkdir -p /opt/cloud/logs/zookeeper2.2. 修改配置文件2.2.1. 修改zo...

hadoop-2.7.1基于QMJ高可用安装配置【代码】

1.修改主机名及hosts文件10.205.22.185 nn1 （主）作用namenode,resourcemanager,datanode,zk,hive,sqoop 10.205.22.186 nn2 （备）作用namenode,resourcemanager,datanode,zk 10.205.22.187 dn1 作用datanode,zk 1.1配置ssh免密码登录主节点能免密码登录各个从节点ssh nn1 ssh nn2 ssh dn1 2. 安装jdk1.8和zookeeper，hive,sqoop可搭建成功后再安装2.1修改profile文件，配置环境变量export JAVA_HOME=/usr/java/jdk1.8.0_65 ...

Hadoophdfspeta2高可用架构介绍【图】

背景介绍 1. hadoop peta的产生目前公司的hadoop hdfs系统为了解决集群规模造成的master瓶颈(由于数据量增大，导致元数据的数据量带来的压力已经不能被一个单点master-namenode所能承担的)，开发了区别于社区版的peta 系统(这里不对社区版的进行介绍)。 2.背景介绍 1. hadoop peta的产生目前公司的hadoop hdfs系统为了解决集群规模造成的master瓶颈(由于数据量增大，导致元数据的数据量带来的压力已经不能被一个单点master-namen...

Hadoop2.6(NN/RM)高可用集群安装与部署

Hadoop2对HDFS的改进很大，支持HDFS(NameNode) 和ResourceManager高可用性，避免集群中单点故障造成整个集群不可用。那么，从本文开始将部署一套高可用Hadoop集群及家族中相关开源系统，具体根据下面规划来，本文只部署高可用Hadoop集群，后续很快更新其他 Hadoop2对HDFS的改进很大，支持HDFS(NameNode) 和ResourceManager高可用性，避免集群中单点故障造成整个集群不可用。那么，从本文开始将部署一套高可用Hadoop集群及家族中相...

部署完全分布式高可用 Hadoop hdfs HA + yarn HA【代码】【图】

部署完全分布式高可用 Hadoop hdfs HA + yarn HA 标签（空格分隔）：大数据运维专栏一：hadoop HDFS HA 与 yarn HA 的概述二：部署环境概述三：部署zookeeper 四：部署HDFS HA 与 yarn HA 五：关于 HA 的测试一：hadoop HDFS HA 与 yarn HA 的概述 1.1 HA 的概述 HA概述1）所谓HA（High Available），即高可用（7*24小时不中断服务）。2）实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制：HDF...

[Hadoop]HDFS-HA高可用完全分布式搭建(基于hadoop-2.6.5的多NameNode形式)【代码】【图】

HDFS-HA高可用完全分布式搭建环境背景 1 修改hosts文件 2 免密钥登录 3 安装zookeeper 4 安装hadoop 5 第一次启动 6 之后的启动和关闭环境背景各虚拟机的系统时间需要同步, 各节点预先安装好jdk1.7 因为多节点有相同操作,使用xshell的同步命令能简化步骤使用的各节点虚拟机操作系统为CentOS_6.5 共四个节点node01,node02,node03,node04,ip分别为 node01 192.168.110.101 node02 192.168.110.102 node03 192.168.110.103 node04 ...

集群 - 相关标签

集群服务器集群技术集群软件

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook Hadoop基础知识 windows部署hadoop-2.7.0 使用 Oracle Load For Hadoop（OLH）实...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop集群(高可用)

Hadoop集群(高可用)

内容导读

内容图文

1. 简介

2. 配置(在之前搭建分布式集群的基础上)

修改配置文件

3. 启动集群

4. 激活namenode

5. HA手动切换

附:自己出的小问题

内容总结

内容备注

内容手机端

【Hadoop集群(高可用)】教程文章相关的互联网学习教程文章

【Hadoop】Hadoop HA 高可用搭建手册【代码】

Hadoop2.x搭建HA(高可用)机制的集群【图】

ubuntu18.04.2 hadoop3.1.2+zookeeper3.5.5高可用完全分布式集群搭建【代码】【图】

最新Hadoop-2.7.2+hbase-1.2.0+zookeeper-3.4.8 HA高可用集群配置安装

高可用Hadoop平台－Oozie工作流【代码】【图】

hadoop+zookepper实现namenode的高可用

Hadoop集群(高可用)【代码】

安装高可用Hadoop生态（二）安装Zookeeper【代码】

hadoop-2.7.1基于QMJ高可用安装配置【代码】

Hadoophdfspeta2高可用架构介绍【图】

Hadoop2.6(NN/RM)高可用集群安装与部署

部署完全分布式高可用 Hadoop hdfs HA + yarn HA【代码】【图】

[Hadoop]HDFS-HA高可用完全分布式搭建(基于hadoop-2.6.5的多NameNode形式)【代码】【图】

HADOOP - 相关标签

集群 - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程