在Ubuntu下搭建Spark群集
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了在Ubuntu下搭建Spark群集,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1834字,纯文字阅读大概需要3分钟。
内容图文
![在Ubuntu下搭建Spark群集](/upload/InfoBanner/zyjiaocheng/1332/788ef41322064ae29213884e0114df94.jpg)
在前一篇文章中,我们已经搭建好了Hadoop的群集,接下来,我们就是需要基于这个Hadoop群集,搭建Spark的群集。由于前面已经做了大量的工作,所以接下来搭建Spark会简单很多。
首先打开三个虚拟机,现在我们需要安装Scala,因为Spark是基于Scala开发的,所以需要安装Scala。在Ubuntu下安装Scala很简单,我们只需要运行
sudo apt-get install scala
就可以安装Scala了。
安装完成后运行scala -version可以看到安装的Scala的版本,我现在2.11版,安装目录是在/usr/share/scala-2.11 。
接下来下载Spark。到官方网站,找到最新版的Spark的下载地址,选择Hadoop版本,
http://spark.apache.org/downloads.html
wget http://spark下载地址
当下载完毕后解压文件:
tar xvf spark-2.0.2-bin-hadoop2.7.tgz
接下来我们需要将解压的文件夹移动到指定目录,因为之前我们Hadoop安装到/usr/local/hadoop,所以我们也可以把Spark放在/usr/local/spark下:
sudo mv spark-2.0.2-bin-hadoop2.7 /usr/local/spark
进入spark文件夹下的conf文件夹,里面有个spark-env.sh.template文件,是spark环境变量设置的目标,我们可以复制一个出来:
cp spark-env.sh.template spark-env.sh
然后编辑该文件
vi spark-env.sh
在文件的末尾我们添加上以下内容:
export SCALA_HOME=/usr/share/scala-2.11 export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 export HADOOP_HOME=/usr/local/hadoop export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop SPARK_MASTER_IP=master SPARK_LOCAL_DIRS=/usr/local/spark SPARK_DRIVER_MEMORY=1G export LD_LIBRARY_PATH=/usr/local/hadoop/lib/native/:$LD_LIBRARY_PATH
这里的内容是根据我虚拟机的环境来的,如果安装的版本和路径不一样,可以根据实际情况更改。
接下来设置slaves文件。
cp slaves.template slaves vi slaves
将内容改为
slave01
slave02
Spark在一台机器上就算配置完毕,接下来在另外两台机器上也做一模一样的配置即可。
启动Spark
在master上,我们先启动Hadoop,然后运行
/usr/local/spark/sbin/start-all.sh
便可启动Spark。
运行jps看看Java进程:
2929 Master
2982 Jps
2294 SecondaryNameNode
2071 DataNode
1929 NameNode
2459 ResourceManager
2603 NodeManager
发现比Hadoop启动的时候多了Master进程。
切换到slave01节点上,运行JPS,看看进程:
1889 Worker
1705 NodeManager
1997 Jps
1551 DataNode
这里比Hadoop的时候多了一个Worker进程。说明我们的Spark群集已经启动成功。
下面访问Spark的网站:
可以看到2个worker都启动。
最后,我们运行一下Spark的示例程序:
/usr/local/spark/bin/run-example SparkPi 10 --slave01 local[2]
可以在结果中找到
Pi is roughly 3.14XXXXX
说明我们运行成功了。
原文:http://www.cnblogs.com/studyzy/p/6204620.html
内容总结
以上是互联网集市为您收集整理的在Ubuntu下搭建Spark群集全部内容,希望文章能够帮你解决在Ubuntu下搭建Spark群集所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。