首页 / HADOOP / Hadoop2.2.0+Spark0.9.0分布式搭建

Hadoop2.2.0+Spark0.9.0分布式搭建

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop2.2.0+Spark0.9.0分布式搭建，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4735字，纯文字阅读大概需要7分钟。

内容图文

软件版本 JDK：jdk-7u45-linux-x64.tar Spark：spark-0.9.0-incubating-bin-hadoop2.tgz Scala：scala-2.10.3.tgz Hadoop：hadoop-2.2.0_x64.tar.gz 集群状况 adai1: Master/NameNode/ResourceManager/SecondaryNameNode adai2: Worker/DataNode/NodeManager

软件版本

JDK：jdk-7u45-linux-x64.tar

Spark：spark-0.9.0-incubating-bin-hadoop2.tgz

Scala：scala-2.10.3.tgz

Hadoop：hadoop-2.2.0_x64.tar.gz

集群状况

adai1: Master/NameNode/ResourceManager/SecondaryNameNode

adai2: Worker/DataNode/NodeManager

adai3: Worker/DataNode/NodeManager

JDK安装

解压缩：

tar -jdk-7u45-linux-x64.tar

将文件夹移动到/usr/lib文件夹下

sudo mv jdk1.7.0_45 /usr/lib/

设置环境变量

sudo vi /etc/profile

在最后添加上

#set java environment

export JAVA_HOME=/usr/lib/jdk1.7.0_45

export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

export JRE_HOME=$JAVA_HOME/jre

让环境变量生效

source /etc/profile

查看版本信息

java –version

Hosts设置

sudo vi /etc/hosts

127.0.0.1 localhost

192.168.1.11 adai1

192.168.1.12 adai2

192.168.1.13 adai3

将hosts文件复制到其他节点上

scp /etc/hosts adai@192.168.1.12:/etc/hosts

scp /etc/hosts adai@192.168.1.13:/etc/hosts

SSH无密码登录

adai1机无密码登录adai2机在adai1机上

sudo get-apt install ssh

ssh-keygen -t rsa （用rsa生成密钥）

cd ~/.ssh (进入用户目录下的隐藏文件.ssh)

cat id_rsa.pub >> authorized_keys (将id_rsa.pub加到授权的key里面去,这步执行完，应该sshlocalhost可以无密码登录本机了，可能第一次要密码)

scp ~/.ssh/id_rsa.pub adai@adai2:~/ (把adai1机下的id_rsa.pub复制到adai2机下)

adai2机上

cat ~/id_rsa.pub >> ~/.ssh/authorized_keys (adai2机把从adai1机复制的id_rsa.pub添加到.ssh/authorzied_keys文件里)

chmod 600 .ssh/authorized_keys （此处权限必须为600）

再配置adai1机无密码登录adai3机

Hadoop配置

hadoop2.2.0 64位机器版本需要自己编译，网上可以下载到其他人编译好的

解压缩

tar -zxvf hadoop-2.2.0_x64.tar.gz

移动文件夹到/opt/目录下

sudo mv hadoop-2.2.0/ /opt/

设置环境变量

sudo vi /etc/profile

添加

export HADOOP_HOME=/opt/hadoop-2.2.0

export PATH=$PATH:$HADOOP_HOME/bin

export YARN_HOME=/opt/hadoop-2.2.0

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

让环境变量生效

source /etc/profile

进入/opt/hadoop-2.2.0/etc/hadoop/目录，修改配置文件

vihadoop-env.sh

export JAVA_HOME=/usr/lib/jdk1.7.0_45

export HADOOP_HOME=/opt/hadoop-2.2.0

export PATH=$PATH:$HADOOP_HOME/bin

vicore-site.xml

fs.defaultFS

hdfs://adai1:9000

io.file.buffer.size

131072

hadoop.tmp.dir

file:/opt/hadoop-2.2.0/tmp_hadoop

Abase forother temporary directories.

hadoop.proxyuser.adai.hosts

hadoop.proxyuser.adai.groups

将mapred-site.xml.templat模板文件重命名

mv mapred-site.xml.templat mapred-site.xml

vi mapred-site.xml

mapreduce.framework.name

yarn

mapreduce.jobhistory.address

adai1:10020

mapreduce.jobhistory.webapp.address

adai1:19888

vi hdfs-site.xml

dfs.namenode.secondary.http-address

adai1:9001

dfs.namenode.name.dir

file:/opt/hadoop-2.2.0/dfs/name

dfs.datanode.data.dir

file:/opt/hadoop-2.2.0/dfs/data

dfs.replication

dfs.webhdfs.enabled

true

vi yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

yarn.resourcemanager.address

adai1:8032

yarn.resourcemanager.scheduler.address

adai1:8030

yarn.resourcemanager.resource-tracker.address

adai1:8031

yarn.resourcemanager.admin.address

adai1:8033

yarn.resourcemanager.webapp.address

adai1:8088

vi slaves

adai2

adai3

将配置文件拷贝到其他节点上

格式化

bin/hadoop namenode –format

启动hadoop

sbin/start-all.sh

jps查看集群情况

Scala安装

解压缩

tar -zxvf scala-2.10.3.tgz

移动到/usr/lib文件夹下

sudo mv scala-2.10.3 /usr/lib/

设置环境变量

sudo vi /etc/profile

在后面增加内容

export SCALA_HOME=/usr/lib/scala-2.10.3

export PATH=$PATH:$SCALA_HOME/bin

配置文件拷贝到其他节点上，让环境变量生效

source /etc/profile

查看版本信息

scala –version

Spark配置

解压缩

tar –zxvf spark-0.9.0-incubating-bin-hadoop2.tgz

移动到opt文件夹下

sudo mv spark-0.9.0-incubating-bin-hadoop2/ /opt/spark

修改环境变量

vi /etc/profile

后面增加内容

export SPARK_HOME=/opt/spark

export PATH=$PATH:$SPARK_HOME/bin

让环境变量生效

source /etc/profile

到conf文件夹下修改配置文件

mv spark-env.sh.templatespark-env.sh

vi spark-env.sh

export SCALA_HOME=/usr/lib/scala-2.10.3

export JAVA_HOME=/usr/lib/jdk1.7.0_45

export SPARK_MASTER_IP=192.168.1.11

export HADOOP_HOME=/opt/hadoop-2.2.0

export SPARK_HOME=/opt/spark

export SPARK_LIBRARY_PATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib/native

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop/

vi slaves

adai2

adai3

将配置文件拷贝到其他节点上

在Master上执行

sbin/start-all.sh

运行Spark自带的例子

./bin/run-exampleorg.apache.spark.examples.SparkPi spark://192.168.1.11:7077

内容总结

以上是互联网集市为您收集整理的Hadoop2.2.0+Spark0.9.0分布式搭建全部内容，希望文章能够帮你解决Hadoop2.2.0+Spark0.9.0分布式搭建所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/564955.html

来源：【匿名】

【上一篇】hadoop2单机搭建【下一篇】php能用hadoop吗

更多 ►

【Hadoop2.2.0+Spark0.9.0分布式搭建】教程文章相关的互联网学习教程文章

hadoop伪分布式2.4.1安装

一、准备：1、修改主机名vi /etc/sysconfig/network内容如下：NETWORKING=yesHOSTNAME=myHadoop2、修改主机名和IP的映射关系vi /etc/hosts192.168.127.150myHadoop3、关闭防火墙3.1、查看防火墙状态service iptables status3.2、关闭防火墙service iptables stop3.3、查看防火墙开机启动状态chkconfig iptables --list3.4、关闭防火墙开机启动chkconfig iptables off4、重启Linux：reboot/shutdown -r now二、安装JDK：1、解压：ta...

Hadoop伪分布式配置【代码】

Hadoop 可以在单节点上以伪分布式的方式运行，Hadoop 进程以分离的 Java 进程来运行，节点既作为 NameNode 也作为 DataNode，同时，读取的是 HDFS 中的文件。Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中，伪分布式需要修改2个配置文件 core-site.xml 和 hdfs-site.xml 。Hadoop的配置文件是 xml 格式.修改配置文件 core-site.xml:通过 gedit 编辑会比较方便: gedit ./etc/hadoop/core-site.xml<configuration><proper...

Hadoop 运行模式之本地&伪分布式模式【代码】【图】

Hadoop运行模式包括：本地模式、伪分布式模式以及完全分布式模式。Hadoop官方网站：http://hadoop.apache.org/一、本地运行模式1、官方Grep案例1、创建在hadoop-2.7.2文件下面创建一个input文件夹 [root@centos7 hadoop2.7]# mkdir input2、将Hadoop的xml配置文件复制到input [root@centos7 hadoop2.7]# cp etc/hadoop/*.xml input3、执行share目录下的MapReduce程序 [root@centos7 hadoop2.7]# bin/hadoop jar share/hadoop/mapre...

使用Docker在本地搭建Hadoop分布式集群

学习Hadoop集群环境搭建是Hadoop入门必经之路。搭建分布式集群通常有两个办法：要么找多台机器来部署（常常找不到机器）或者在本地开多个虚拟机（开销很大，对宿主机器性能要求高，光是安装多个虚拟机系统就得搞半天……）。那么，问题来了！有没有更有可行性的办法？提到虚拟化，Docker最近很是火热！不妨拿来在本地做虚拟化，搭建Hadoop的伪分布式集群环境。虽然有点大材小用，但是学习学习，练练手也是极好的。更多详情，猛戳这...

centos 6.6 hadoop 2.7.1 完全分布式安装部署【图】

1.安装前，准备三台CENTOS 6.6系统的主机或虚机,并且关闭防火墙及selinux.2.按如下表格配置IP地址，修改hosts文件及本机名192.168.199.21 hadoop21 Master102.168.199.22 hadoop22 Slave1192.168.199.23 hadoop23 Slave2650) this.width=650;" src="/upload/getfiles/default/2022/11/8/20221108025206968.jpg" width="632" height="359" name="image_operate_78961438613426977" title="centos <wbr>6.6 <wbr>hadoop <wbr>2.7....

Hadoop1.2.1 完全分布式集群搭建实操笔记

前期准备工作： 1.修改Linux主机名：/etc/hostname ubuntu系统：vi /etc/hostname 将ubuntu默认的主机名ubuntu改为suh01 2.修改IP：/etc/network/interfaces 修改配置文件/etc/network/interfaces vi /etc/network/interfaces #将原来的内容注释掉： #auto lo ...

centos6.4设备hadoop-2.5.1（完全分布式）【图】

环境介绍：在这两种装备centos6.4（32位置）的server安装Hadoop-2.5.1分布式集群（2台机器，主要试验用。哈哈）。1．改动主机名和/etc/hosts文件1）改动主机名（非必要）vi /etc/sysconfig/network HOSTNAME=XXX重新启动后生效。2）/etc/hosts是ip地址和其相应主机名文件，使机器知道ip和主机名相应关系。格式例如以下：#IPAddress HostName 192.168.1.67 MasterServer 192.168.1.241 SlaveServer 2．配置免password登陆SSH1）生成...

hadoop分布式集群环境搭建【图】

参考 http://www.cnblogs.com/zhijianliutang/p/5736103.html 1 wget http://mirrors.shu.edu.cn/apache/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.tar.gz2 解压 tar -zxvf hadoop-2.9.2.tar.gz3 配置环境变量 vim /etc/profile　　export HADOOP_HOME=/usr/hadoop-2.9.2　　export PATH=$PATH:$HADOOP_HOME/bin4 验证 $ hadoop version 配置ssh无密登录。。。。原文：https://www.cnblogs.com/syscn/p/10138750.html

hadoop2.x hdfs完全分布式 HA 搭建【代码】

官网链接 hadoop配置文件主页：http://hadoop.apache.org/docs/r2.5.2/HDFS hapdoop HA全分布配置:http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html总结步骤：准备工作： 1. 配置java环境变量可以在/etc/profile 或者在/root/.bash_profile中进行配置 2. 配置免密码登录特别是namenode之间可以相互免密码登录 3. 准备zookeeper a)三台zookeeper：hadoop1，hadoop2，h...

docker中搭建分布式hadoop集群【代码】

1、pull Ubuntu镜像配置Java环境2、下载hadoop软件包3、配置JAVA_HOME（hadoop-env.sh、mapred-env.sh、yarn-env.sh）4、配置core-site.xml<configuration><property><name>fs.defaultFS</name><value>hdfs://127.17.0.5:8020</value></property><property><name>hadoop.tmp.dir</name><value>/home/root/data/tmp</value></property></configuration>5、配置hdfs-site.xml<configuration><property><name>dfs.namenode.secondary....

hadoop完全分布式模式的安装和配置

本文是将三台电脑用路由器搭建本地局域网，系统为centos6.5,已经实验验证，搭建成功。一、设置静态IP&修改主机名&关闭防火墙（all-root）（对三台电脑都需要进行操作）0.将三台电脑安装centos6.5系统1.设置静态ip（便于机器之间的通信，防止路由器电脑重启后，ip变化，导致不能通信）vim /etc/sysconfig/network-scripts/ifcfg-eth0DEVICE=eth0 #描述网卡对应的设备别名，例如ifcfg-eth0的文件中它为eth0BOOTPROTO=static #设置网卡...

在RHEL 6.5上部署Hadoop 2.6伪分布式模式（单机）【代码】【图】

第一步：安装JAVA 1.7 此步骤略过，太简单了，可参考这个： http://blog.sina.com.cn/s/blog_6a7cdcd40101b1j6.html 第二步：创建Haddop专用用户虽然使用root用户也可以部署hadoop,但从系统安全及规范的角度考虑，还是建议大家创建专用的用户（本例中为hadoop,实际中可以是任意用户名），创建用户的命令：# useradd hadoop # passwd hadoop 创建完用户hadoop后，还要使得hadoop用户可以无密码方...

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook Hadoop基础知识 windows部署hadoop-2.7.0 使用 Oracle Load For Hadoop（OLH）实...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop2.2.0+Spark0.9.0分布式搭建

Hadoop2.2.0+Spark0.9.0分布式搭建

内容导读

内容图文

软件版本

集群状况

JDK安装

Hosts设置

SSH无密码登录

Hadoop配置

Scala安装

Spark配置

内容总结

内容备注

内容手机端

【Hadoop2.2.0+Spark0.9.0分布式搭建】教程文章相关的互联网学习教程文章

hadoop伪分布式2.4.1安装

Hadoop伪分布式配置【代码】

Hadoop 运行模式之本地&伪分布式模式【代码】【图】

使用Docker在本地搭建Hadoop分布式集群

centos 6.6 hadoop 2.7.1 完全分布式安装部署【图】

Hadoop1.2.1 完全分布式集群搭建实操笔记

centos6.4设备hadoop-2.5.1（完全分布式）【图】

hadoop分布式集群环境搭建【图】

hadoop2.x hdfs完全分布式 HA 搭建【代码】

docker中搭建分布式hadoop集群【代码】

hadoop完全分布式模式的安装和配置

在RHEL 6.5上部署Hadoop 2.6伪分布式模式（单机）【代码】【图】

hadoop2.x 伪分布式安装 centos6.5 64位【图】

Hadoop学习笔记01——Hadoop分布式文件系统

我不是九爷带你了解 Hadoop分布式文件系统设计要点与架构【图】

分布式 - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程