首页 / HADOOP / Windows 下部署 hadoop spark环境

Windows 下部署 hadoop spark环境

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Windows 下部署 hadoop spark环境，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3296字，纯文字阅读大概需要5分钟。

内容图文

一、先在本地安装jdk

我这里安装的jdk1.8,具体的安装过程这里不作赘述

二、部署安装maven

下载maven安装包，并解压

Windows 下部署 hadoop spark环境 - 文章图片

设置环境变量，MAVEN_HOME=D:\SoftWare\Maven\apache-maven-3.6.1

Windows 下部署 hadoop spark环境 - 文章图片

在path路径添加;%MAVEN_HOME%\bin

打开本地终端验证

Windows 下部署 hadoop spark环境 - 文章图片

三、安装hadoop

先下载hadoop压缩包下载地址：https://archive.apache.org/dist/hadoop/common/hadoop-2.6.0/

下载后解压到本地

Windows 下部署 hadoop spark环境 - 文章图片

配置环境变量

计算机 –>属性 –>高级系统设置 –>高级选项卡 –>环境变量 –> 单击新建HADOOP_HOME

Windows 下部署 hadoop spark环境 - 文章图片

HADOOP_HOME=D:\SoftWare\hadoop-2.6.0

Path环境变量下配置【%HADOOP_HOME%\bin;】变量

打开终端验证一下hadoop是否安装成功

Windows 下部署 hadoop spark环境 - 文章图片

给hadoop添加插件，添加到hadoop/bin目录下

Windows 下部署 hadoop spark环境 - 文章图片

修改hadoop的配置文件，配置文件在路径D:\SoftWare\hadoop-2.6.0\etc\hadoop下

修改core-site.xml

Windows 下部署 hadoop spark环境 - 文章图片

<configuration>
   <!--指定namenode的地址-->
  <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
  </property>
  
     <!--用来指定hadoop产生临时文件的目录-->
  <property>
        <name>hadoop.tmp.dir</name>
        <value>/D:/SoftWare/hadoop-2.6.0/tmp/</value>
  </property>
   
      <!--用于设置检查点备份日志的最长时间-->
  <property>
        <name>fs.checkpoint.period</name>
        <value>3600</value>
  </property>
</configuration>

修改hdfs-site.xml

Windows 下部署 hadoop spark环境 - 文章图片

<configuration>
    <!--指定hdfs保存数据的副本数-->
  <property>
        <name>dfs.replication</name>
        <value>2</value>
  </property>
  
    <!--指定hdfs中namenode的存储位置-->
  <property>
        <name>dfs.namenode.name.dir</name>
        <value>/D:/SoftWare/hadoop-2.6.0/tmp/dfs/namenode</value>
  </property>
  
    <!--指定hdfs中datanode的存储位置-->
  <property>
        <name>dfs.datanode.data.dir</name>
        <value>/D:/SoftWare/hadoop-2.6.0/tmp/dfs/datanode</value>
  </property>
</configuration>

修改mapred-site.xml

Windows 下部署 hadoop spark环境 - 文章图片

<configuration>
  <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
  </property>
</configuration>

修改yarn-site.xml

Windows 下部署 hadoop spark环境 - 文章图片

<configuration>

<!-- Site specific YARN configuration properties -->

    <!--nodemanager获取数据的方式是shuffle-->
      <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
      </property>

       <property>
            <name>yarn.resourcemanager.hostname</name>
            <value>localhost</value>
      </property>
    
      <property>
            <name>yarn.log-aggregation-enable</name>
            <value>true</value>
      </property>
</configuration>

格式化系统文件

hadoop/bin下执行 hdfs namenode -format

Windows 下部署 hadoop spark环境 - 文章图片

格式化完毕后启动hadoop,到hadoop/sbin下执行 start-dfs启动hadoop

Windows 下部署 hadoop spark环境 - 文章图片

这个时候会自动打开另外两个终端窗口，日志没有报错就行了，

Windows 下部署 hadoop spark环境 - 文章图片

打开浏览器访问 http://localhost:50070

Windows 下部署 hadoop spark环境 - 文章图片

　　启动yarn

Windows 下部署 hadoop spark环境 - 文章图片

打开浏览器访问 http://localhost:8088

Windows 下部署 hadoop spark环境 - 文章图片

在hdfs创建文件夹

Windows 下部署 hadoop spark环境 - 文章图片

把本地的文本文件上传到hdfs

Windows 下部署 hadoop spark环境 - 文章图片

然后运行hadoop 提供的demo，计算单词数

Windows 下部署 hadoop spark环境 - 文章图片

四、安装scala

下载scala的安装包到本地

Windows 下部署 hadoop spark环境 - 文章图片

双击

Windows 下部署 hadoop spark环境 - 文章图片

选择安装的路径

Windows 下部署 hadoop spark环境 - 文章图片

配置scala的环境变量

Windows 下部署 hadoop spark环境 - 文章图片

设置 Path 变量：找到系统变量下的"Path"如图，单击编辑。在"变量值"一栏的最前面添加如下的路径： %SCALA_HOME%\bin;%SCALA_HOME%\jre\bin;

Windows 下部署 hadoop spark环境 - 文章图片

设置 Classpath 变量：找到找到系统变量下的"Classpath"如图，单击编辑，如没有，则单击"新建":

"变量名"：ClassPath
"变量值"：.;%SCALA_HOME%\bin;%SCALA_HOME%\lib\dt.jar;%SCALA_HOME%\lib\tools.jar.;

Windows 下部署 hadoop spark环境 - 文章图片

检查环境变量是否设置好了：调出"cmd"检查。单击【开始】，在输入框中输入cmd，然后"回车"，输入 scala，然后回车，如环境变量设置ok，你应该能看到这些信息

Windows 下部署 hadoop spark环境 - 文章图片

五、安装spark

下载安装包

Windows 下部署 hadoop spark环境 - 文章图片

解压到需要安装的路径下

Windows 下部署 hadoop spark环境 - 文章图片

配置spark的环境变量

Windows 下部署 hadoop spark环境 - 文章图片

将spark的bin路径添加到path中

Windows 下部署 hadoop spark环境 - 文章图片

cmd输入spark-shell

Windows 下部署 hadoop spark环境 - 文章图片

spark已经安装成功了！

六、在IDEA添加scala插件

Windows 下部署 hadoop spark环境 - 文章图片

内容总结

以上是互联网集市为您收集整理的Windows 下部署 hadoop spark环境全部内容，希望文章能够帮你解决Windows 下部署 hadoop spark环境所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/951067.html

来源：【匿名】

【上一篇】VMware安装Hadoop（1）【下一篇】php能用hadoop吗

更多 ►

【Windows 下部署 hadoop spark环境】教程文章相关的互联网学习教程文章

集群配置虚拟主机及部署Hadoop集群碰到的问题【代码】【图】

配置集群方案Ubuntu下的配置apache虚拟主机方案:对其中的Master节点配置虚拟主机，可以通过Chrome浏览器访问目录。安装虚拟主机之前，先安装Apache2sudo apt-get install apache2再安装php5sudo apt-get install php5然后，进入 /etc/apache2/sites-available文件夹，添加”*.conf”文件往该文件里写入<VirtualHost *:80>ServerName author.xxx.comServerAdmin author.xxx.comDocumentRoot "/home/author"<Directory "/home/au...

Hadoop集群安装部署(VMware)【图】

一、hadoop版本介绍不收费的Hadoop版本主要有三个（均是国外厂商），分别是：Apache（最原始的版本，所有发行版均基于这个版本进行改进）、Cloudera版本（Cloudera’s Distribution Including Apache Hadoop，简称　CDH）、Hortonworks版本(Hortonworks Data Platform，简称“HDP”），对于国内而言，绝大多数选择CDH版本。　　Cloudera的CDH和Apache的Hadoop对应关系：　　CDH的两个系列版本分别是CDH3和CDH4，CDH3对应Hadoop 1.0...

centos 6.6 hadoop 2.7.1 完全分布式安装部署【图】

1.安装前，准备三台CENTOS 6.6系统的主机或虚机,并且关闭防火墙及selinux.2.按如下表格配置IP地址，修改hosts文件及本机名192.168.199.21 hadoop21 Master102.168.199.22 hadoop22 Slave1192.168.199.23 hadoop23 Slave2650) this.width=650;" src="/upload/getfiles/default/2022/11/8/20221108025206968.jpg" width="632" height="359" name="image_operate_78961438613426977" title="centos <wbr>6.6 <wbr>hadoop <wbr>2.7....

NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr4.8.1部署(二）

??Precondition:hadoop 2.7.1 hbase 1.0.1.1 / hbase 0.98.13192.168.1.106 ->master 192.168.1.105 ->slave / regionservershbase部署直接下载hbase bin文件hbase1.0.1.1 还有hbase 0.98.13 和hadoop2.7.1 / hadoop 2.5.2 配合并没有问题。只不过Nutch2.3 似乎和hbase 0.98.13 配合比较好。1. 配置hbase-site.xml<configuration> <property><name>hbase.zookeeper.quorum</name><value>192.168.1.105,192.168.1.106</value> </pro...

Hadoop实战-初级部分之 Hadoop安装部署

私塾在线《深入浅出学 Hadoop- 初级部分》 —— 系列精品教程整体课程概览第一部分：开始云计算之旅第二部分：初识Hadoop第三部分：Hadoop 环境安装部署第四部分：Hadoop Shell 基本操作介绍第五部分：Hadoop 分布式文件系统1第五部分：Hadoop 分布式文件系统2第五部分：Hadoop 分布式文件系统3第六部分：MapReduce 开发1第六部分：MapReduce 开发2第七部分：Hadoop集群的安装本节课程概览Hadoop 在windows 上伪分布...

在RHEL 6.5上部署Hadoop 2.6伪分布式模式（单机）【代码】【图】

第一步：安装JAVA 1.7 此步骤略过，太简单了，可参考这个： http://blog.sina.com.cn/s/blog_6a7cdcd40101b1j6.html 第二步：创建Haddop专用用户虽然使用root用户也可以部署hadoop,但从系统安全及规范的角度考虑，还是建议大家创建专用的用户（本例中为hadoop,实际中可以是任意用户名），创建用户的命令：# useradd hadoop # passwd hadoop 创建完用户hadoop后，还要使得hadoop用户可以无密码方...

OpenStack部署到Hadoop的四种方案

随着企业开始同时利用云计算和大数据技术，现在应当考虑如何将这些工具结合使用。在这种情况下，企业将实现最佳的分析处理能力，同时利用私有云的快速弹性(rapid elasticity) 和单一租赁的特性。如何协同效用和实现部署，是本文希望解决的问题。一些基础知识　　第一是OpenStack 。作为目前最流行的开源云版本，它包括控制器、计算(Nova)、存储 (Swift)、消息队列 (RabbitMQ) 和网络 (Quantum) 组件。图 1 提供了这些组件的一个图示...

Mac部署hadoop3(伪分布式)【代码】【图】

环境信息操作系统：macOS Mojave 10.14.6JDK：1.8.0_211 (安装位置：/Library/Java/JavaVirtualMachines/jdk1.8.0_211.jdk/Contents/Home)hadoop：3.2.1开通ssh在"系统偏好设置"->"共享"，设置如下：免密码登录执行以下命令创建秘钥：ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa一路next，最终会在~/.ssh目录生成id_rsa和id_rsa.pub文件执行以下命令，将自己的秘钥放在ssh授权目录，这样ssh登录自身就不需要输入密码了：cat ~/.ssh/...

阿里云ECS服务器部署HADOOP集群（五）：Pig 安装【代码】

本篇将在阿里云ECS服务器部署HADOOP集群（一）：Hadoop完全分布式集群环境搭建的基础上搭建。 1 环境介绍一台阿里云ECS服务器：master操作系统：CentOS 7.3Hadoop：hadoop-2.7.3.tar.gzJava: jdk-8u77-linux-x64.tar.gzPig: pig-0.17.0.tar.gz2 Pig 下载下载 pig-0.17.0.tar.gz 并在合适的位置解压缩，笔者这里解压缩的路径为:/usr/local将解压得到的目录改名为 hbase 1 cd /usr/local 2mv pig-0.17.0/ pig/3 添加 Pig 环境变量在"...

Hadoop 部署之环境准备(一)【代码】

一、软硬件规划 ID主机类型主机名IP应用软件操作系统硬件配置1物理机namenode01192.168.1.200jdk1.8.0_171、hadoop-2.7.3、hive-2.3.3、hbase-1.2.6、zookeeper-3.4.10、spark-2.3.1CentOS7.46核CPU、8G内存、250存储2物理机datanode01192.168.1.201jdk1.8.0_171、hadoop-2.7.3、hive-2.3.3、hbase-1.2.6、zookeeper-3.4.10、spark-2.3.1CentOS7.46核CPU、8G内存、250存储3物理机datanode02192.168.1.202jdk1.8.0_171、hadoop-2.7....

hadoop高可用的完全分布式部署

1、将zookeeper-3.4.6.tar.gz解压（例：root目录下）2、将/root/zookeeper-3.4.6/conf/zoo_simple.cfg修改为zoo.cfg并修改zookeeper存放文件的目录：dataDir=/tmp/zookeeper添加：#其中1、2、3是zookeeper的服务编号，后面是对应服务器的主机名server.1=zlj02:2888:3888server.2=my01:2888:3888server.3=my02:2888:38883、mkdir /tmp/zookeeper（三个zookeeper所在的机器都要）4、创建并存放各自zookeeper的服务编号：vim /tmp/zoo...

Hadoop 2.2.0部署安装（笔记，单机安装）【代码】【图】

SSH无密安装与配置具体配置步骤：◎ 在root根目录下创建.ssh目录（必须root用户登录）cd /root & mkdir .sshchmod 700 .ssh & cd .ssh◎ 创建密码为空的 RSA 密钥对：ssh-keygen -t rsa -P ""◎ 在提示的对称密钥名称中输入 id_rsa将公钥添加至 authorized_keys 中：cat id_rsa.pub >> authorized_keyschmod 644 authorized_keys # 重要◎ 编辑 sshd 配置文件 /etc/ssh/sshd_config ，把 #AuthorizedKeysFile .ssh/authorized_ke...

SPARK安装二：HADOOP集群部署【代码】

一、hadoop下载使用2.7.6版本，因为公司生产环境是这个版本cd /opt wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.7.6/hadoop-2.7.6.tar.gz二、配置文件参考文档：https://hadoop.apache.org/docs/r2.7.6 在$HADOOP_HOME/etc/hadoop目录下需要配置7个文件1.core-site.xml<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>fs....

Ganglia监控Hadoop集群的安装部署[转]【代码】【图】

Ganglia监控Hadoop集群的安装部署一、安装环境 Ubuntu server 12.04安装gmetad的机器：192.168.52.105安装gmond的机器：192.168.52.31，192.168.52.32，192.168.52.33，192.168.52.34，192.168.52.35，192.168.52.36，192.168.52.37，192.168.52.38，192.168.52.105浏览监控web页面的机器：192.168.52.105 二、介绍 Ganglia 监控套件包括三个主要部分：gmond，gmetad，和网页接口，通常被称为ganglia- web。gmond 是一个守护...

Hadoop NFS GateWay部署深入详解【代码】【图】

目的：通过挂载的方式，可以类似访问本地磁盘的方式一样的访问Hadoop文件，简单、方便、快捷。0.系统版本&hadoop版本 1）系统版本[root@WEB-W031 sbin]# cat /etc/issueCentOS release 5.8 (Final)2）Hadoop版本[root@WEB-W031 /]# hadoop version Hadoop 2.7.2 Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r b165c4fe8a74265c792ce23f546c64604acf0e41 Compiled by jenkins on2016-01-26T00:08Z Compiled w...

环境 - 相关标签

环境变量配置环境变量怎么设置

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook Hadoop基础知识 windows部署hadoop-2.7.0 使用 Oracle Load For Hadoop（OLH）实...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Windows 下部署 hadoop spark环境

Windows 下部署 hadoop spark环境

内容导读

内容图文

内容总结

内容备注

内容手机端

【Windows 下部署 hadoop spark环境】教程文章相关的互联网学习教程文章

集群配置虚拟主机及部署Hadoop集群碰到的问题【代码】【图】

Hadoop集群安装部署(VMware)【图】

centos 6.6 hadoop 2.7.1 完全分布式安装部署【图】

NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr4.8.1部署(二）

Hadoop实战-初级部分之 Hadoop安装部署

在RHEL 6.5上部署Hadoop 2.6伪分布式模式（单机）【代码】【图】

OpenStack部署到Hadoop的四种方案

Mac部署hadoop3(伪分布式)【代码】【图】

阿里云ECS服务器部署HADOOP集群（五）：Pig 安装【代码】

Hadoop 部署之环境准备(一)【代码】

hadoop高可用的完全分布式部署

Hadoop 2.2.0部署安装（笔记，单机安装）【代码】【图】

SPARK安装二：HADOOP集群部署【代码】

Ganglia监控Hadoop集群的安装部署[转]【代码】【图】

Hadoop NFS GateWay部署深入详解【代码】【图】

WINDOWS - 相关标签

HADOOP - 相关标签

环境 - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程