首页 / HADOOP / hadoop学习准备
hadoop学习准备
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了hadoop学习准备,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1334字,纯文字阅读大概需要2分钟。
内容图文
![hadoop学习准备](/upload/InfoBanner/zyjiaocheng/1322/59c76395108840c6bec1e6e7900651ea.jpg)
一、知识预热
1、了解hadoop概念,及其家族树。
hadoop是是一个能够对大量数据进行分布式处理的软件框架。
上图,我是这么理解的,类似于之前的java学习,java是核心,在此基础之上 衍生了spring,struct,hibernate等等有助于java开发的框架。
相对于hadoop是核心,在此基础之上有MapReduce,HDFS,Hive,HBase等各种补充hadoop功能的子项目。
2、各子项目功能
Common: 为其它子项目提供支持的常用工具,提供基本服务, 并且会为运行在该平台上的软件开发提供所需的API.
Avro: 用于数据序列化的系统.
MapReduce: 是一种编程模型, 用于大规模数据集的并行计算.
HDFS: 是一个分布式文件系统.
Chukwa: 是开源的数据收集系统, 用于监控和分析大型分布式系统的数据.
Hive: 是一个建立在Hadoop基础之上的数据仓库, 提供了一些用于对Hadoop文件中的数据集进行数据整理, 特殊查询和分析存储的工具. 它支持类似于传统RDBMS中的SQL语言的查询语言.
HBase: 是一个分布式的, 面向列的开源数据库, 适合于非结构化数据存储的数据库.主要用于需要随机访问, 实时读写的大数据.
Pig: 是一个对大型数据集进行分析, 评估的平台. 它的结构能够经受住高度并行化的检验,使得它能够处理大型的数据集.
ZooKeeper: 是一个为分布式应用所设计的开源协调服务.主要为用户提供同步, 配置管理, 分组和命名等服务, 减轻分布式应用程序所承担的协调任务.
原文:http://www.cnblogs.com/ag2163/p/3615606.html
内容总结
以上是互联网集市为您收集整理的hadoop学习准备全部内容,希望文章能够帮你解决hadoop学习准备所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。