首页 / HADOOP / Linux下安装Hadoop 详解及WordCount运行

Linux下安装Hadoop 详解及WordCount运行

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Linux下安装Hadoop 详解及WordCount运行，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3196字，纯文字阅读大概需要5分钟。

内容图文

单机配置环境如下：
Hadoop（3.1.1）安装包

JDK1.8.0_231安装包
Centos -Linux系统环境
使用ssh进行本地免密登录
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys
chmod 755 ~/.ssh/authorized_key
登录成功：
安装并配置JDK
tar -zxvf jdk-8u231-linux-x64.tar.gz
mkdir /usr/loca/java
cp jdk1.8.0_231 /usr/local/java/
vim /etc/profile
export JAVA_HOME=/usr/local/java/jdk1.8.0_231/
export PATH=$JAVA_HOME/bin:$PATH
java -version
解压缩Hadoop安装包
tar -zxvf FusionInsight-Hadoop-3.1.1.tar.gz
解压缩后出现hadoop的文件夹
配置Hadoop环境变量
export HADOOP_HOME=/home/lhh/hive/hadoop/
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
创建机器名字
vim /etc/hostname

vim /etc/hosts

hostname hadoop-01
重启服务器，修改生效
配置Hadoop中的相应文件
./hadoop/etc/hadoop/hadoop-env.sh、core-site.xml、mapred-site.xml、hdfs-site.xml、yarn-site.xml
./hadoop/sbin/start-dfs.sh、stop-dfs.sh、start-yarn.sh、stop-yarn.sh

新建hadoop-env.sh配置如下：
export JAVA_HOME=/usr/local/java/jdk1.8.0_231/
注意：hadoop-3.1.1版本需要手动创建该文件
core-site.xml配置如下：
<configuration> <property> <name>hadoop.tmp.dir</name> <value>/home/lhh/hive/tmp</value> <description>Abase for other temporary directories.</description> </property> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop-01:9000</value> </property> <property> <name>hadoop.proxyuser.root.hosts</name> <value>*</value> </property> <property> <name>hadoop.proxyuser.root.groups</name> <value>*</value> </property> </configuration>
mapred-site.xml配置如下：
<configuration> <property> <name>mapred.job.tracker</name> <value>hadoop-1:9001</value> </property> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
hdfs-site.xml配置如下：
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/home/lhh/hive/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/home/lhh/hive/tmp/dfs/data</value> </property> </configuration>
yarn-site.xml配置文件如下：
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>hadoop-01</value> </property> <property> <name>yarn.nodemanager.env-whitelist</name> <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME,HADOOP_HOME,PATH,LANG,TZ</value> </property> </configuration>

8.运行Hadoop

在解压后的hadoop目录下使用如下命令：
./bin/hdfs namenode -format
开启NameNode、DataNode等守护进程
./sbin/start-all.sh
./sbin/mr-jobhistory-daemon.sh start historyserver
查看进程信息
查看Web UI
lsof -i:9870
查看端口是否被监听，在网页输入如下网址：
http://10.71.232.64:9870

9.运行WordCount
1）本地创建test.txt文件
2）在HDFS新建一个文件夹，用于上传测试文件
./bin/hdfs dfs -mkdir /test
3）将本地text.txt上传到test目录中
./bin/hdfs dfs -put /home/lhh/hive/test.txt /test
4）运行WordCount
./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.1-hw-ei-302005.jar wordcount /test/test.txt /test/out
Linux下安装Hadoop 详解及WordCount运行 - 文章图片
5）查看结果
./bin/hadoop fs -cat /test/out/part-r-00000
9.hadoop2.x/3.x常用端口号览表

Linux下安装Hadoop 详解及WordCount运行 - 文章图片

内容总结

以上是互联网集市为您收集整理的Linux下安装Hadoop 详解及WordCount运行全部内容，希望文章能够帮你解决Linux下安装Hadoop 详解及WordCount运行所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/934307.html

来源：【匿名】

【上一篇】Windows10系统下Hadoop和Hive开发环境搭建填坑指南【下一篇】php能用hadoop吗

更多 ►

【Linux下安装Hadoop 详解及WordCount运行】教程文章相关的互联网学习教程文章

Hadoop入门程序WordCount的执行过程【代码】【图】

首先编写WordCount.java源文件，分别通过map和reduce方法统计文本中每个单词出现的次数，然后按照字母的顺序排列输出，　　Map过程首先是多个map并行提取多个句子里面的单词然后分别列出来每个单词，出现次数为1，全部列举出来　　Reduce过程首先将相同key的数据进行查找分组然后合并，比如对于key为Hello的数据分组为：<Hello, 1>、<Hello,1>、<Hello,1>，合并之后就是<Hello,1+1+1>，分组也可以理解为reduce的操作，合并减少数据...

Java笔记---Hadoop 2.7.1下WordCount程序详解【代码】【图】

一、前言在之前我们已经在 CenOS6.5 下搭建好了 Hadoop2.x 的开发环境。既然环境已经搭建好了，那么现在我们就应该来干点正事嘛！比如来一个Hadoop世界的HelloWorld，也就是WordCount程序(一个简单的单词计数程序)二、WordCount 官方案例的运行2.1 程序简介WordCount程序是hadoop自带的案例，我们可以在 hadoop 解压目录下找到包含这个程序的 jar 文件(hadoop-mapreduce-examples-2.7.1.jar)，该文件所在路径为 hadoop/share/hadoo...

hadoop自带例子wordcount的具体运行步骤

1.在hadoop所在目录“usr/local”下创建一个文件夹inputroot@ubuntu:/usr/local# mkdir input2.在文件夹input中创建两个文本文件file1.txt和file2.txt，file1.txt中内容是“hello word”,file2.txt中内容是“hello hadoop”、“hello mapreduce”(分两行)。root@ubuntu:/usr/local# cd inputroot@ubuntu:/usr/local/input# echo "hello word" > file1.txtroot@ubuntu:/usr/local/input# echo "hello hadoop" > file2.txtroot@ub...

hadoop wordcount异常

最近学习hadoop，在windows+eclipse+虚拟机hadoop集群环境下运行mapreduce程序遇到了很多问题。上网查了查，并经过自己的分析，最终解决，在此分享一下，给遇到同样问题的人提供参考。我的hadoop集群环境：虚拟机上4台机器：192.168.137.111（master）、192.168.137.112（slave1）、192.168.137.113（slave2）、192.168.137.114（slave3）hadoop集群用户名：hadoophadoop版本：hadoop-1.1.2开发环境：windows7+eclipse+hadoop插件异...

hadoop伪分布式之配置yarn并运行MR程序（WordCount）【代码】【图】

1、配置集群（1）在yarn-env.sh中配置JAVA_HOMEexport JAVA_HOME=/opt/module/jdk1.8.0_11（2）在yarn-site.xml中配置<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.resourcemanager.hostname</name><value>hadoop01</value></property>（3）配置mapred-env.shexport JAVA_HOME=/opt...

hadoop的统计单词程序WordCount提示找不到WordCount类【代码】

按这里的教程： http://www.imooc.com/learn/391 试验时，发现在wordcount的最后一步一直提示如下错误：Exception in thread "main" java.lang.ClassNotFoundException:WordCountat java.net.URLClassLoader$1.run(URLClassLoader.java:366)at java.net.URLClassLoader$1.run(URLClassLoader.java:355)at java.security.AccessController.doPrivileged(Native Method)at java.net.URLClassLoader.findClass(URLClassLoader.java:35...

hadoop的wordcount的改动版

//这个是在原来的基础上改动以后得到的，将当中的分词的根据给换掉了，而且进行词频统计的时候会自己主动的忽略大写和小写 packageorg.apache.hadoop.mapred; importjava.io.IOException;importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;importjava.util.StringTokenizer; importorg.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configured;importorg.apache.hadoop.fs.Path;impor...

hadoop学习（六）WordCount示例深度学习MapReduce过程（1）

花了整整一个下午（6个多小时），整理总结，也算是对这方面有一个深度的了解。日后可以回头多看看。我们都安装完Hadoop之后，按照一些案例先要跑一个WourdCount程序，来测试Hadoop安装是否成功。在终端中用命令创建一个文件夹，简单的向两个文件中各写入一花了整整一个下午（6个多小时），整理总结，也算是对这方面有一个深度的了解。日后可以回头多看看。我们都安装完Hadoop之后，按照一些案例先要跑一个WourdCount程序，...

Hadoop中运行WordCount【图】

上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境，今天介绍如何运行Hadoop环境下的第一个实例WordCount。在伪分布模式下运行一下hadoop自带的例子WordCount来感受以下MapReduce过程：这时注意程序是在文件系统dfs运行的，创建的文件上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境，今天介绍如何运行Hadoop环境下的第一个实例WordCount。在伪分布模式下运行一下hadoop自带的例子W...

hadoopwordcount新API例子

准备准备一些输入文件，可以用hdfs dfs -put xxx/*?/user/fatkun/input上传文件代码 package com.fatkun;?import java.io.IOException;import java.util.ArrayList;import java.util.List;import java.util.StringTokenizer;?import org.apache.commons.lo准备准备一些输入文件，可以用hdfs dfs -put xxx/*?/user/fatkun/input上传文件代码 package com.fatkun; ? import java.io.IOException; import java.util.ArrayList; im...

hadoop第一个程序WordCount.java的编译运行过程

java是hadoop开发的标准官方语言，本文下载了官方的WordCount.java并对其进行了编译和打包，然后使用测试数据运行了该hadoop程序。这里假定已经装好了hadoop的环境，在Linux下运行hadoop命令能够正常执行；下载java版本的WordCount.java程序。将WordCountjava是hadoop开发的标准官方语言，本文下载了官方的WordCount.java并对其进行了编译和打包，然后使用测试数据运行了该hadoop程序。这里假定已经装好了hadoop的环境，在Linux...

fedora17中hadoop2.2.0在eclipse下运行wordcount

hadoop2.2.0的eclipse插件在http://download.csdn.net/detail/acm_er6/6964345 ，下载后直接拷贝到/usr/lib/eclipse/plugins/目录下然后重启eclipse后如果eclipse右边出现一头hadoop标志的小象即说明插件安装成功。然后窗口—首选项，选择Hadoop Map/Reducehadoop2.2.0的eclipse插件在http://download.csdn.net/detail/acm_er6/6964345 ，下载后直接拷贝到/usr/lib/eclipse/plugins/目录下然后重启eclipse后如果eclipse右边出现一头...

hadoop学习（七）WordCount+Block+Split+Shuffle+Map+Reduce技术【图】

纯干活：通过WourdCount程序示例：详细讲解MapReduce之BlockSplitShuffleMapReduce的区别及数据处理流程。 Shuffle过程是MapReduce的核心，集中了MR过程最关键的部分。要想了解MR，Shuffle是必须要理解的。了解Shuffle的过程，更有利于我们在对MapReduce job纯干活：通过WourdCount程序示例：详细讲解MapReduce之Block+Split+Shuffle+Map+Reduce的区别及数据处理流程。Shuffle过程是MapReduce的核心，集中了MR过程最关键的部分。要...

Hadoop2.0YARNcloudra4.4.0WordCount实例【图】

其他都没啥这个 jar都在这里了。 import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Te 其他都没啥这个 jar都在这里了。 import java.io.IOException; import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration; import org.apache.had...

hadoop之配置yarn并运行MR程序（WordCount）【代码】【图】

1、配置集群（1）在yarn-env.sh中配置JAVA_HOME export JAVA_HOME=/opt/module/jdk1.8.0_11 （2）在yarn-site.xml中配置 <property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value> </property>  <property><name>yarn.resourcemanager.hostname</name><value>hadoop01</value> </property>（3）配置mapred-env.sh export JAVA_...

WORD - 相关标签

Wordnet wordpress安装 word转html

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook 使用 Oracle Load For Hadoop（OLH）实...Hadoop基础知识 windows部署hadoop-2.7.0 你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Linux下安装Hadoop 详解及WordCount运行

Linux下安装Hadoop 详解及WordCount运行

内容导读

内容图文

内容总结

内容备注

内容手机端

【Linux下安装Hadoop 详解及WordCount运行】教程文章相关的互联网学习教程文章

Hadoop入门程序WordCount的执行过程【代码】【图】

Java笔记---Hadoop 2.7.1下WordCount程序详解【代码】【图】

hadoop自带例子wordcount的具体运行步骤

hadoop wordcount异常

hadoop伪分布式之配置yarn并运行MR程序（WordCount）【代码】【图】

hadoop的统计单词程序WordCount提示找不到WordCount类【代码】

hadoop的wordcount的改动版

hadoop学习（六）WordCount示例深度学习MapReduce过程（1）

Hadoop中运行WordCount【图】

hadoopwordcount新API例子

hadoop第一个程序WordCount.java的编译运行过程

fedora17中hadoop2.2.0在eclipse下运行wordcount

hadoop学习（七）WordCount+Block+Split+Shuffle+Map+Reduce技术【图】

Hadoop2.0YARNcloudra4.4.0WordCount实例【图】

hadoop之配置yarn并运行MR程序（WordCount）【代码】【图】

HADOOP - 相关标签

LINUX - 相关标签

WORD - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程