首页 / HADOOP / Hadoop Yarn环境配置

Hadoop Yarn环境配置

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop Yarn环境配置，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3508字，纯文字阅读大概需要6分钟。

内容图文

抄一个可行的Hadoop Yarn环境配置。用的官方的2.2.0版本。

http://www.jdon.com/bigdata/yarn.html

Hadoop 2.2新特性

将Mapreduce框架升级到Apache YARN，YARN将Map reduce工作区分为两个：JobTracker组件：实现资源管理和任务JOB；计划/监视组件：划分到单独应用中。使用MapReduce的2.0，开发人员现在可以直接Hadoop内部基于构建应用程序。Hadoop2.2也已经在微软widnows上支持。

YARN带来了：

1.HDFS的高可靠性
2.HDFS snapshots快照
3.支持HDFS中的 NFSv3 文件系统。

Yarn/map reduce2.0架构图：

其中灰绿的箭头是Mapreduce处理流程，黑色虚线是任务Job提交，由客户端提交给RM，由各个节点发出资源请求到RM获取，当然他们也将各自的状态反馈到到RM。

安装Hadoop 2.2

从http://mirror.metrocast.net/apache/hadoop/common/stable2/下载。百度云盘下载。

解压到/home/hduser/yarn目录，假设hadoop是用户名。

$ tar -xvzf hadoop-2.2.0.tar.gz
$ mv hadoop-2.2.0 /home/hadoop/yarn/hadoop-2.2.0
$ cd /home/hadoop/yarn
$ sudo chown -R hadoop:hadoop hadoop-2.2.0
$ sudo chmod -R 755 hadoop-2.2.0

在~/.bashrc设置环境，将下面加入：

export HADOOP_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0
export HADOOP_MAPRED_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0
export HADOOP_COMMON_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0
export HADOOP_HDFS_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0
export YARN_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0
export HADOOP_CONF_DIR=$HOME/Programs/Hadoop/hadoop-2.2.0/etc/hadoop

$ source ~/.bashrc

创建Hadoop数据目录：

$ mkdir -p $HOME/yarn/yarn_data/hdfs/namenode

$ mkdir -p $HOME/yarn/yarn_data/hdfs/datanode

配置：

$ cd $YARN_HOME
$ vi etc/hadoop/yarn-site.xml
编辑 yarn-site.xml

加入下面喊在yarn-site.xml:

#etc/hadoop/yarn-site.xml .
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

单个集群节点设置：

$ vi etc/hadoop/core-site.xml
加入下面内容在配置
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>

$ vi etc/hadoop/hdfs-site.xml
加入下面内容
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name> <value>file:/home/hadoop/yarn/yarn_data/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name> <value>file:/home/hadoop/yarn/yarn_data/hdfs/datanode</value>
</property>

$ vi etc/hadoop/mapred-site.xml
如果这个文件不存在，创建，拷贝粘贴下面的配置。

<?xml version="1.0"?>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

格式化namenode(Onetime Process)
$ bin/hadoop namenode -format

启动HDFS处理和Map-Reduce 处理：

# HDFS(NameNode & DataNode)部分：
$ sbin/hadoop-daemon.sh start namenode
$ sbin/hadoop-daemon.sh start datanode

# MR(Resource Manager, Node Manager & Job History Server).部分：
$ sbin/yarn-daemon.sh start resourcemanager
$ sbin/yarn-daemon.sh start nodemanager
$ sbin/mr-jobhistory-daemon.sh start historyserver

确认安装：

$ jps
# 应该输出：
22844 Jps
28711 DataNode
29281 JobHistoryServer
28887 ResourceManager
29022 NodeManager
28180 NameNode

运行wordcount单词计数案例：

$ mkdir input
$ cat > input/file
This is word count example
using hadoop 2.2.0

将目录加入hadoop:

$ bin/hadoop hdfs -copyFromLocal input /input

在HADOOP_HOME运行wordcount案例：:
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /input /output
检查输出：
$ bin/hadoop dfs -cat /out/*
This 2
Another 1
is 2
line 1
one 2

检查WebUI，浏览器打开端口：http://localhost:50070

可以在http://localhost:8088检查应用程序的状态：

原文：http://www.cnblogs.com/ITEagle/p/3578813.html

内容总结

以上是互联网集市为您收集整理的Hadoop Yarn环境配置全部内容，希望文章能够帮你解决Hadoop Yarn环境配置所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1132501.html

来源：【匿名】

【上一篇】hadoop 启动停止命令【下一篇】php能用hadoop吗

更多 ►

【Hadoop Yarn环境配置】教程文章相关的互联网学习教程文章

hadoop--环境配置

1:修改主机名和IP的映射关系 vim /etc/hosts 192.168.1.101 itcast2:修改主机名: vi /etc/sysconfig/network (Master )3:关闭防火墙 #查看防火墙状态 service iptables status #关闭防火墙　　service iptables stop #查看防火墙开机启动状态　　chkconfig iptables --list #关闭防火墙开机启动　　chkconfig iptables off4:安装jdk 1)：mkdir /uer/java2): 将jdk解压至/usr/java ./jdk-6u45-linux-i...

Linux下hadoop和spark的基础环境配置准备

我使用了4台虚拟机centos7来搭建环境，2个主结点（一般是一个，但为了体验zookeeper，万一其中一个master挂掉呢，另外一个会自动启动接管），2个从结点注意：下面的配置主要以主节点为例进行说明第一步：同步四台机器的时钟　　sudo yum install ntpdate，确保已安装ntpdate，分别运行sudo ntpdate cn.pool.ntp.org第二步：设置主机名修改/etc/sysconfig/network文件，NETWORKING = yesHOSTNAME = master(主节点)其实在centos7下面...

Hadoop Yarn环境配置【图】

抄一个可行的Hadoop Yarn环境配置。用的官方的2.2.0版本。http://www.jdon.com/bigdata/yarn.html Hadoop 2.2新特性将Mapreduce框架升级到Apache YARN，YARN将Map reduce工作区分为两个：JobTracker组件：实现资源管理和任务JOB；计划/监视组件：划分到单独应用中。使用MapReduce的2.0，开发人员现在可以直接Hadoop内部基于构建应用程序。Hadoop2.2也已经在微软widnows上支持。YARN带来了：1.HDFS的高可靠性2.HDFS snapshots快照...

HDFS 实验 (二) hadoop 环境配置【图】

需要sun的jdk，所以先要卸载openjdk[root@hadoop-1 ~]# rpm -qa | grep openjdk | xargs rpm -e --nodeps好了release noteshttp://hadoop.apache.org/releases.html4月8日有一个3.1的新版本，下下来wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-3.1.0/hadoop-3.1.0.tar.gzuseradd hadoopcd /home/hadoopsu - hadooptar -zxvf hadoop-3.1.0.tar.gz生成keyssh-keygen -t rsa尝试登录本机，pemission denied了容我修...

Hadoop伪分布式环境配置

Step1:关闭防火墙　　service iptables stop[status] 　　 service iptables status chkconfig --list |grep iptables 　　chkconfig iptables offStep2:修改IP 　　(重启网卡：service network restart)Step3:修改hostname 　　/etc/hostsStep4:SSH免密码登陆产生密钥(~/.ssh中)ssh-keygen -t rsa 　　cd ~/.ssh:cpid_rsa.pub authorized_keysStep5:安装JDK 　/usr/local中环境变量生效source /etc/profileStep6:...

Hadoop环境配置(基础)【图】

环境配置配置网络环境（个人训练）关闭防火墙修改名字建立数据链加入环境变量设置免密传输配置网络环境（个人训练） $ vi/etc/sysconfig/network-cripts.ifcfg-ens33 没有的，如下加入设置 DCHP 改为static IPADDR=192.168.3.129 NETMASK=255.255.255.0 GATEWAY=192.168.3.2 ONBOOT=yes PREFIX=24 有的在里面改就行然后在物理机修改网卡打开你的网卡设置双击打开，或者右键打开属性再打开VMware虚拟网络配置设置广播ip（...

hadoop环境的配置【代码】

1、所需软件所需要的环境包括java，ssh必须保证sshd一直运行，以便用Hadoop脚本管理远端Hadoop守护进程 Windows下的附加软件需求 Cygwin 提供上述软件之外的shell支持。 2、安装软件 sudo apt-get install ssh sudo apt-get install rsync由于hadoop是基于java编写的，因此需要安装jdk 3、下载安装参考资料：https://www.jianshu.com/p/cdae5bab030f 为了获取Hadoop的发行版，从Apache的某个镜像服务器上下载最近的稳定发行版 ...

Windows&Mac下开发环境配置：jdk、windows本地hadoop安装【代码】【图】

Windows&Mac下开发环境配置四、知识要点jdk、windows本地hadoop安装目录要求：不包含中文、不包含空格5. hdfs的java API开发环境准备 1. 修改hosts文件 1. windows本修改hosts文件所在位置C:\Windows\System32\drivers\etc\hosts 将虚拟机中/etc/hosts文件以下内容，添加到windows的hosts文件末尾(根据自己的实际情况，修改ip地址) 192.168.51.100 node01.kaikeba.com node01 192.168.51.110 node02.kaikeba.com node02 192.168...

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook 使用 Oracle Load For Hadoop（OLH）实...Hadoop基础知识 windows部署hadoop-2.7.0 你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop Yarn环境配置

Hadoop Yarn环境配置

内容导读

内容图文

安装Hadoop 2.2

内容总结

内容备注

内容手机端

【Hadoop Yarn环境配置】教程文章相关的互联网学习教程文章

hadoop--环境配置

Linux下hadoop和spark的基础环境配置准备

Hadoop Yarn环境配置【图】

HDFS 实验 (二) hadoop 环境配置【图】

Hadoop伪分布式环境配置

Hadoop环境配置(基础)【图】

hadoop环境的配置【代码】

Windows&Mac下开发环境配置：jdk、windows本地hadoop安装【代码】【图】

HADOOP - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程