首页 / 大数据 / 流式大数据计算实践（2）----Hadoop集群和Zookeeper

流式大数据计算实践（2）----Hadoop集群和Zookeeper

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了流式大数据计算实践（2）----Hadoop集群和Zookeeper，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1918字，纯文字阅读大概需要3分钟。

内容图文

一、前言

1、上一文搭建好了Hadoop单机模式，这一文继续搭建Hadoop集群

二、搭建Hadoop集群

1、根据上文的流程得到两台单机模式的机器，并保证两台单机模式正常启动，记得第二台机器core-site.xml内的fs.defaultFS参数值要改成本机的来启动，启动完毕后再改回来

2、清空数据，首先把运行单机模式后生成的数据全部清理掉

            rm -rf /work/hadoop/nn/current

rm -rf /work/hadoop/dn/current
hdfs namenode -format

3、启动集群

（1）storm1作为namenode节点，所以在这台机上面执行命令启动namenode

$HADOOP_PREFIX/sbin/hadoop-daemon.sh --script hdfs start namenode

（2）storm2作为datanode节点，所以在这台机上面执行命令启动datanode

$HADOOP_PREFIX/sbin/hadoop-daemon.sh --script hdfs start datanode

（3）通过jps命令可以看到对应的节点，然后通过50070的控制台可以看到storm2的datanode节点

技术分享图片

三、ZooKeeper

1、Zookeeper是分布式框架经常要用到的应用协调服务，相当于让分布式内的每个组件同步起来

2、Zookeeper安装

（1）下载Zookeeper的tar.gz包，并解压

（2）配置环境变量

vim /etc/profile

#set zookeeper env
export ZOOKEEPER_HOME=/work/soft/zookeeper-3.4.13

source /etc/profile

（3）配置ZooKeeper

①进入到Zookeeper目录的conf文件夹，可以看到里面有一个配置文件的模板zoo_sample.cfg，将模板复制一份到zoo.cfg

②然后编辑内容，只需要修改Zookeeper的存放数据的目录（记得创建对应文件夹）

vim /work/soft/zookeeper-3.4.13/conf/zoo.cfg

dataDir=/work/zookeeper/data

③继续编辑bin目录下的zkEnv.sh文件来修改Zookeeper存放日志的目录（记得创建对应文件夹）

vim /work/soft/zookeeper-3.4.13/bin/zkEnv.sh

ZOO_LOG_DIR=/work/zookeeper/logs

④进入到刚刚设定的数据目录，创建一个文件myid，并写入本台机器的Zookeeper Id，这个id的取值范围是1-255，我这里取得分别是1和2

vim /work/zookeeper/data/myid

1

（4）启动单机版Zookeeper

①首先启动Zookeeper

$ZOOKEEPER_HOME/bin/zkServer.sh start

②进入到Zookeeper的控制台查看数据目录是否正常

$ZOOKEEPER_HOME/bin/zkCli.shls /

技术分享图片

（5）启动集群版Zookeeper

①先停止单机版

$ZOOKEEPER_HOME/bin/zkServer.sh stop

②把刚刚单机版产生的数据删除，执行删除目录时，一定要小心不要输错，还有记得再把刚才的myid文件创建出来- -

            rm -rf /work/zookeeper/data/*
rm -rf /work/zookeeper/logs/*

③进入Zookeeper的conf目录，编辑zoo.cfg，在文件末尾配置Zookeeper集群的节点信息

vim /work/soft/zookeeper-3.4.13/conf/zoo.cfg

server.1=storm1:2888:3888
server.2=storm2:2888:3888

④在每台机器启动Zookeeper，然后通过jps命令查看进程是否存在

$ZOOKEEPER_HOME/bin/zkServer.sh start

jps

技术分享图片

⑤使用查看集群状态命令，在每台机器执行，可以发现一台是leader，另一台是follower，说明集群是OK的

$ZOOKEEPER_HOME/bin/zkServer.sh status

技术分享图片

原文：https://www.cnblogs.com/orange911/p/9990328.html

内容总结

以上是互联网集市为您收集整理的流式大数据计算实践（2）----Hadoop集群和Zookeeper全部内容，希望文章能够帮你解决流式大数据计算实践（2）----Hadoop集群和Zookeeper所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1296600.html

来源：【匿名】

【下一篇】phpexcel导入大数据内存溢出的解决方法有哪些

更多 ►

【流式大数据计算实践（2）----Hadoop集群和Zookeeper】教程文章相关的互联网学习教程文章

流式大数据计算实践（2）----Hadoop集群和Zookeeper【代码】【图】

一、前言1、上一文搭建好了Hadoop单机模式，这一文继续搭建Hadoop集群二、搭建Hadoop集群1、根据上文的流程得到两台单机模式的机器，并保证两台单机模式正常启动，记得第二台机器core-site.xml内的fs.defaultFS参数值要改成本机的来启动，启动完毕后再改回来2、清空数据，首先把运行单机模式后生成的数据全部清理掉rm -rf /work/hadoop/nn/currentrm -rf /work/hadoop/dn/currenthdfs namenode -format3、启动集群（1）storm1作为n...

入门大数据---基于Zookeeper搭建Spark高可用集群【代码】【图】

一、集群规划这里搭建一个 3 节点的 Spark 集群，其中三台主机上均部署 Worker 服务。同时为了保证高可用，除了在 hadoop001 上部署主 Master 服务外，还在 hadoop002 和 hadoop003 上分别部署备用的 Master 服务，Master 服务由 Zookeeper 集群进行协调管理，如果主 Master 不可用，则备用 Master 会成为新的主 Master。二、前置条件搭建 Spark 集群前，需要保证 JDK 环境、Zookeeper 集群和 Hadoop 集群已经搭建，相关步骤可以参...

大数据架构培训视频教程 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis 云计算【图】

培训大数据架构开发！从零基础到高级，手把手培训！[技术QQ：2937765541]? ?----------------------------------------------------------------------------------------------------------------------------------课程目录：获取视频资料和培训解答技术支持地址?课程展示(永久免费更新！永久免费培训解答技术支持！)：获取视频资料和培训解答技术支持地址?原文：http://twskyn.iteye.com/blog/2289784

大数据 - Zookeeper【图】

Zookeeper1. Zookeeper概念简介：Zookeeper是一个分布式协调服务；就是为用户的分布式应用程序提供协调服务A、zookeeper是为别的分布式程序服务的B、Zookeeper本身就是一个分布式程序（只要有半数以上节点存活，zk就能正常服务）C、Zookeeper所提供的服务涵盖：主从协调、服务器节点动态上下线、统一配置管理、分布式共享锁、统一名称服务……D、虽然说可以提供各种服务，但是zookeeper在底层其实只提供了两个功能：管理(存储，读...

大数据学习（22）—— ZooKeeper能做些什么【代码】

官网上已经给出了zk的几种典型应用场景，原话是这么说的：It exposes a simple set of primitives that distributed applications can build upon to implement higher level services for synchronization, configuration maintenance, and groups and naming. 它提供了一组简单的原语，让分布式应用可以实现更高层次的服务，比如同步、配置维护、命名服务等等。除了官方提到的这些用途之外，它还可以实现分布式锁、分布式协调通知...

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算【图】

从零基础到高级，一对一培训！[技术QQ：2937765541] ------------------------------------------------------------------------------------------------------------------------------------------- 课程体系：获取视频资料和培训解答技术支持地址课程展示(大数据技术很广，一直在线为你培训解答！)：获取视频资料和培训解答技术支持地址大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeep...

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算视频教程 Java互联网架构师【图】

从零基础到高级，一对一技术培训！全程技术指导！[技术QQ：2937765541] https://item.taobao.com/item.htm?id=535950178794 ------------------------------------------------------------------------------------- Java互联网架构师培训！https://item.taobao.com/item.htm?id=536055176638大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算视频教程 Java互...

大数据运维架构师培训（1）：Zookeeper，Hadoop（HDFS,MR,Yarn）

一、风哥大数据运维架构师实战培训专题2.0介绍课程背景：为满足想学习和掌握大数据运维与体系架构的学员，风哥特别设计的一套比较系统的大数据库运维培训课程。课程目标：本套风哥大数据运维架构师实战培训课程，分5个阶段：大数据Hadoop核心架构运维实战、大数据存储管理与查询分析实战、大数据计算框架与消息搜索实战、大数据安全调度与数据采集实战、大数据集群管理平台运维实战。学完本套风哥大数据课程可以熟悉Hadoop大数据生...

大数据系列之分布式数据库HBase-1.2.4+Zookeeper 安装及增删改查实践【代码】【图】

之前介绍过关于HBase 0.9.8版本的部署及使用，本篇介绍下最新版本HBase1.2.4的部署及使用，有部分区别，详见如下：1. 环境准备：1.需要在Hadoop[hadoop-2.7.3] 启动正常情况下安装，hadoop安装可参考LZ的文章大数据系列之Hadoop分布式集群部署2. 资料包 zookeeper-3.4.9.tar.gz,hbase-1.2.4-bin.tar.gz 2. 安装步骤：1.安装zookeeper1.解压zookeeper-3.4.9.tar.gzcd tar -xzvf zookeeper-3.4.9.tar.gz ll zookeeper-3.4.9 2.新建...

【大数据Zookeeper系列】 Zookeeper Java 客户端 ——Apache Curator

文章目录Zookeeper Java 客户端 ——Apache Curator一、基本依赖二、客户端相关操作2.1 创建客户端实例 2.2 重试策略 2.3 判断服务状态三、节点增删改查3.1 创建节点 2.2 获取节点信息 2.3 获取子节点列表 2.4 更新节点 2.5 删除节点 2.6 判断节点是否存在三、监听事件3.1 创建一次性监听 3.2 创建永久监听 3.3 监听子节点Zookeeper Java 客户端 ——Apache Curator 一、基本依赖

大数据系列之协同服务Zookeeper知识整理（二）Zookeeper上的数据操作，使用JAVA API来访问Zookeeper【图】

1.Zookeeper上的数据操作上一篇中我们介绍了zk是什么，以及zk的工作流程。既然zk是协调服务的，那必然会存储一些节点的信息，比附说Hadoop高可用集群HA的活跃NameNode信息，活跃ResourceManager信息（后面会介绍配置HA），Kafka的消息对了等等一些分布式节点信息，那这些基本信息是存储在zk哪里的，以及格式是什么样子？启动zk的客户端与服务器 $>bin/zkServer.sh start $>zkCli.sh -server s10:2181 //进入zk命令行我们...

好程序员大数据培训之ZooKeeper应用-解决分布式系统单点故障【图】

大数据课程涵盖Java、spark、Hadoop等内容，而不是Java中涵盖大数据，现在是大数据的时代，学习大数据课程之前必须先了解大数据课程大纲，否则很容易学到假的大数据课程。　　今天小编给大家分享一下：ZooKeeper应用--解决分布式系统单点故障　　1.单点故障问题　　什么是分布式系统中的单点故障：通常分布式系统采用主从模式，就是一个主控机连接多个处理节点。主节点负责分发任务，从节点负责处理任务，当我们的主节点发生故障时...

大数据基础（1）zookeeper3选举算法【代码】

提到zookeeper选举算法，就不得不提Paxos算法，因为zookeeper选举算法是Paxos算法的一个变种； Paxos要解决的问题是：在一个分布式网络环境中有众多的参与者，但是每个参与者都不可靠，可能随时掉线等，这时这些参与者如何针对某个看法达成一致；类似的问题现实生活中有很多，比如一个团队要组织团建，团队中有10个人，每个人都有自己想去的地方，如何就团建的目的地达成一致？最简单的方式是把团队全体叫到会议室开会，很快就...

zookeeper-如何修改源码-《每日五分钟搞定大数据》【代码】【图】

本篇文章仅仅是起一个抛砖迎玉的作用，举一个如何修改源码的例子。文章的灵感来自 ZOOKEEPER-2784。提一个问题先之前的文章讲过zxid的设计，我们先复习下：zxid有64位，分成两部分：高32位是Leader的epoch：选举时钟，每次选出新的Leader，epoch累加1 低32位是在这轮epoch内的事务id：对于用户的每一次更新操作集群都会累加1。这么设计会存在什么问题？ Zookeeper 的事务 ID 有可能会超过 32 位。 epoch增长非常慢，超过32位需要...

【大数据Zookeeper系列】 Zookeeper ACL

文章目录Zookeeper ACL一、前言二、使用Shell进行权限管理2.1 设置与查看权限 2.2 权限组成 2.3 添加认证信息 2.4 权限设置示例1. world模式 2. auth模式 3. digest模式 4. ip模式 5. super模式三、使用Java客户端进行权限管理3.1 主要依赖 3.2 权限管理APIZookeeper ACL 一、前言为了避免存储在 Zookeeper 上的数据被其他程序或者人为误修改，Zookeeper 提供了 ACL(Access Control Lists) 进行权限控制。只有拥有对应权限的用户...

首页 / 大数据 / 流式大数据计算实践（2）----Hadoop集群和Zookeeper

流式大数据计算实践（2）----Hadoop集群和Zookeeper

内容导读

内容图文

一、前言

二、搭建Hadoop集群

三、ZooKeeper

内容总结

内容备注

内容手机端

【流式大数据计算实践（2）----Hadoop集群和Zookeeper】教程文章相关的互联网学习教程文章

流式大数据计算实践（2）----Hadoop集群和Zookeeper【代码】【图】

入门大数据---基于Zookeeper搭建Spark高可用集群【代码】【图】

大数据架构培训视频教程 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis 云计算【图】

大数据 - Zookeeper【图】

大数据学习（22）—— ZooKeeper能做些什么【代码】

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算【图】

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算视频教程 Java互联网架构师【图】

大数据运维架构师培训（1）：Zookeeper，Hadoop（HDFS,MR,Yarn）

大数据系列之分布式数据库HBase-1.2.4+Zookeeper 安装及增删改查实践【代码】【图】

【大数据Zookeeper系列】 Zookeeper Java 客户端 ——Apache Curator

大数据系列之协同服务Zookeeper知识整理（二）Zookeeper上的数据操作，使用JAVA API来访问Zookeeper【图】

好程序员大数据培训之ZooKeeper应用-解决分布式系统单点故障【图】

大数据基础（1）zookeeper3选举算法【代码】

zookeeper-如何修改源码-《每日五分钟搞定大数据》【代码】【图】

【大数据Zookeeper系列】 Zookeeper ACL

ZOOKEEPER - 相关标签

HADOOP - 相关标签

集群 - 相关标签

大数据 - 最新教程

大数据 - 最热教程