首页 / HADOOP / Hadoop学习笔记之HBase应用场景

Hadoop学习笔记之HBase应用场景

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop学习笔记之HBase应用场景，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4122字，纯文字阅读大概需要6分钟。

内容图文

今天的主要来分析一下HBase的特点，提出一些真实的应用场景，利用HBase去解决应用中的效率问题；

HBase特点概述
HBase是google的Bigtable的开源实现，建立在HDFS上，提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。
HBase介于nosql和rdbms之间，仅能通过主键(row key)和主键的range来检索数据，仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。
主要用来存储非结构化和半结构化的松散数据。因为底层是Hadoop所以完全和hadoop一样，Hbase目标主要依靠横向扩展，通过不断增加廉价的商用服务器，来增加计算和存储能力。
HBase中的表一般有这样的特点：
分析我们的业务的时候我们不要从关系数据库表的结构去构思未来表的结构。我们主要去看我们的数据的特点是否具备我们上面提到三个特点。如果具备的话我们一般认为这种业务数据适合放到HBase上来存储。

大：一个表可以有上亿行，上百万列；数据量大，并且表很宽；
面向列：面向列(族)的存储和权限控制，列(族)独立检索；
稀疏：对于为空(null)的列，并不占用存储空间，因此，表可以设计的非常稀疏；

HBase应用场景分析
场景1：对变形金刚实时数据监控应用（虚拟场景）
1.场景描述：
2.业务分析

我们主要是对某个变形金刚的一段时间内状态进行分析，实时对变形金刚的状态进行监控和分析；
假如我们的每一帧数据作为一行的话，我们的表会很宽，有100个列簇，1000*100列；

我们来看我下设计图

Hadoop学习笔记之HBase应用场景 - 文章图片

从大这个特点上来我们这个场景是满足的。
从宽的特点上来说我们这个场景也是可以满足的。

变形金刚上提供数据传输模块，对1000个零部件的状态的指标进行监控并以1秒/帧实时传输到数据中心；
假如现在有100个变形金刚，数据量=1000（指标）*100个变形金刚=100000条指标；
一年的数据量是31536亿条指标，那么存储十年的数据的话我就不算了，太大了。

编写测试实例

package com.hugy.hadoop.invoke;

import java.io.IOException;
import java.util.Date;
import java.util.Iterator;
import java.util.List;
import java.util.Random;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.client.Result;
import com.hugy.hadoop.hbase.HBaseHelper;

public class HBaseInvoke {

	/**
	 * @param args
	 * @throws IOException
	 */
	public static void main(String[] args) throws IOException {
		System.out.println("HBase 操作开始...");
		Configuration conf = new Configuration();
		conf.set("hbase.zookeeper.quorum", "hadoop");
		conf.set("hbase.zookeeper.property.clientPort", "2181");
		HBaseHelper hbase = new HBaseHelper(conf);

		// 2.1创建表
		String tableName = "thransformersdata";// 变形金刚指标数据存储表
		hbase.deleteTable(tableName);
		String colFamilies[] = { "thransformer1","thransformer2","thransformer3","thransformer4","thransformer5"};
		hbase.createTable(tableName, colFamilies); 	
		Random random = new Random();
		Date  starttime=new Date();
		long rowkey = starttime.getTime()/1000;
		for (int x = 1; x <=5; x++)// 5秒钟的数据
		{
			rowkey++;
			//一秒钟一帧数据
			for (int i = 1; i <= 5; i++)// 5个变形金刚
			{
				for (int j = 1; j <= 100; j++)// 100个指标
				{
					hbase.insertRecord(tableName,Long.toString(rowkey), "thransformer"+i, "quota"+j,
						Float.toString(0.3f));
				}
			}
		}
		
		// 2.4查询整个Table
		List<Result> list = null;
		list = hbase.getAllRecord(tableName);
		Iterator<Result> it = list.iterator();
		while (it.hasNext()) {
			Result rs2 = it.next();
			for (KeyValue kv : rs2.raw()) {
				System.out.print("row key is : " + new String(kv.getRow()));
				System.out.print("family is  : " + new String(kv.getFamily()));
				System.out.print("qualifier is:"
						+ new String(kv.getQualifier()));
				System.out.print("timestamp is:" + kv.getTimestamp());
				System.out.println("Value  is  : " + new String(kv.getValue()));
			}

		}

	}

}

部分输出结果输出如下：
row key is : 1406466972 family is? : thransformer3 qualifier is:quota91 timestamp is:1406495760290 Value? is? : 0.3
row key is : 1406466972 family is? : thransformer3 qualifier is:quota92 timestamp is:1406495760314 Value? is? : 0.3
row key is : 1406466972 family is? : thransformer3 qualifier is:quota93 timestamp is:1406495760352 Value? is? : 0.3
row key is : 1406466972 family is? : thransformer3 qualifier is:quota94 timestamp is:1406495760366 Value? is? : 0.3
row key is : 1406466972 family is? : thransformer3 qualifier is:quota95 timestamp is:1406495760379 Value? is? : 0.3
row key is : 1406466972 family is? : thransformer3 qualifier is:quota96 timestamp is:1406495760437 Value? is? : 0.3
row key is : 1406466972 family is? : thransformer3 qualifier is:quota97 timestamp is:1406495760450 Value? is? : 0.3

内容总结

以上是互联网集市为您收集整理的Hadoop学习笔记之HBase应用场景全部内容，希望文章能够帮你解决Hadoop学习笔记之HBase应用场景所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1012051.html

来源：【匿名】

【上一篇】Hadoop 学习笔记之Hive安装【下一篇】php能用hadoop吗

更多 ►

【Hadoop学习笔记之HBase应用场景】教程文章相关的互联网学习教程文章

Hadoop学习笔记（一）—hadoop2.5.2+zookeeper3.6.4+centosx64+vmware11环境搭建【代码】【图】

前言大数据实在是太热，一直对新技术充满着向往，其实hadoop也不是新技术，已经好几年了。打算学习，一下hadoop整个生态圈的内容。这篇文章介绍一下环境搭建，自己搭环境摸索了好几天连着，终于搭建完成，记录一下。并share一下，如果哪天你也需要，大家一起共勉。在这希望...

Hadoop学习笔记(3)——分布式环境搭建【图】

Hadoop学习笔记(3) ——分布式环境搭建前面，我们已经在单机上把Hadoop运行起来了，但我们知道Hadoop支持分布式的，而它的优点就是在分布上突出的，所以我们得搭个环境模拟一下。在这里，我们采用这样的策略来模拟环境，我们使用3台ubuntu机器，1台为作主机(master)，另外2台作为从机(slaver)。同时，这台主机，我们就用第一章中搭建好的环境来。我们采用与第一章中相似的步骤来操作: 运行环境搭建在前面，我们知道，运行hadoo...

Hadoop源码学习笔记之NameNode启动流程分析二：http server启动源码剖析【代码】【图】

NameNodeHttpServer启动源码剖析，这一部分主要按以下步骤进行：　　一、源码调用分析　　二、伪代码调用流程梳理　　三、http server服务流程图解第一步，源码调用分析　　前一篇文章已经锁定到了NameNode.java类文件，搜索找到main()，可以看到代码只有寥寥几行，再筛除掉一些参数校验以及try-catch逻辑代码，　　剩下的核心的代码甚至只有两行，如下： 1publicstaticvoid main(String argv[]) throws Exception {2if (DFSUtil.p...

Hadoop学习笔记—17.Hive框架学习【图】

一、Hive：一个牛逼的数据仓库1.1 神马是Hive？　　Hive 是建立在 Hadoop 基础上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer...

Hadoop 学习笔记1【图】

1. Hadoop 最出名的是 MapReduce和 HDFS，不过也有很多其他有用的子项目。技术栈如下： Core 一系列分布式文件系统和通用I/O的组件和接口（序列化、Java RPC和持久化数据结构）Avro 一种提供高效、跨语言RPC的数据序列系统，持久化数据存储。MapReduce 分布式数据处理模式和执行环境，运行于大型商用机集群。HDFS 分布式文件系统，运行于大型商用机集群。Pig 一种数据流语言和运行环境，用以检索非常大的数据集。...

Hadoop学习笔记之Hadoop伪分布式环境搭建

搭建为伪分布式Hadoop环境1、宿主机（Windows）与客户机（安装在虚拟机中的Linux）网络连接。a) Host-only 宿主机与客户机单独组网；好处：网络隔离；坏处：虚拟机和其他服务器之间不能通讯；b) Bridge 桥接宿主机与客户机在同一个局域网中。好处：窦在同一个局域网，可以互相访问；坏处：不完全。2、Hadoop的为分布式安装步骤a) 设置静态IP在centos下左面上右上角图标右键修改；重启网卡service network restart;验证：执行命令i...

Hadoop学习笔记（三）——zookeeper的一致性协议：ZAB

ZAB：ZooKeeper的Atomic Broadcast协议，能够保证发给各副本的消息顺序相同。Zookeeper使用了一种称为Zab（ZookeeperAtomic Broadcast）的协议作为其一致性复制的核心，其特点为高吞吐量、低延迟、健壮、简单，但不过分要求其扩展性。 Zookeeper的实现是有Client、Server构成，Server端提供了一个一致性复制、存储服务，Client端会提供一些具体的语义，比如分布式锁、选举算法、分布式互斥等。从存储内容来说，Server端更多的是存储...

hadoop学习笔记

map函数执行结束后，map输出的<k, v>一共有4个，分别是<hello, 1><you, 1>,<hello, 1>,<me, 1>分区，默认只有一个分区排序 <hello, 1>,<hello, 1>,<me, 1><you, 1>分组把相同key的value放到一个集合中 <hello, {1,1}><me, {1}><you, {1}>，每一组调用一次reduce函数归约（可选）map任务输出的临时结果存放在linux磁盘上。原文：http://my.oschina.net/sniperLi/blog/364008

hadoop1.0.3学习笔记【代码】【图】

回到目录最近要从网上抓取数据下来，然后hadoop来做存储和分析。每晚尽量更新呆毛王赛高月子酱赛高小唯酱赛高目录安装hadoop1.0.3HDFSwordcountmapreduce去重mapreduce算平均分mapreduce排序安装hadoop1.0.3 1 ubuntu中安装hadoop 1.0.32 ------------伪分布式安装-------------3 1.安装ssh4 sudo apt-get install openssh-server5 如果出现E:Could not open lock file /var/lib/dpkg/lock6 可能是前...

hadoop学习笔记2---hadoop的三种运行模式

1、单机模式安装简单，在一台机器上运行服务，几乎不用做任何配置，但仅限于调试用途。没有分布式文件系统，直接读写本地操作系统的文件系统。2、伪分布式模式在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondary namenode等进程，模拟分布式运行的各个节点。配置已经很接近完全分布式。3、完全分布式模式正常的Hadoop集群，由多个各司其职的节点构成。原文：http://blog.51cto.com/xiaoxiaozhou/2128670

Hadoop学习笔记0002——HDFS文件操作

Hadoop学习笔记0002——HDFS文件操作说明：Hadoop之HDFS文件操作常有两种方式，命令行方式和JavaAPI方式。方式一：命令行方式Hadoop文件操作命令形式为：hadoop fs -cmd <args>说明：cmd是具体的文件操作命令，<args>是一组数目可变的参数。Hadoop最常用的文件操作命令，包括添加文件和目录、获取文件、删除文件等。 1 添加文件和目录HDFS有一个默认工作目录/usr/$USER，其中$USER是你的登录用户名，作者的用户名是root。该目录不...

hadoop-sqoop学习笔记

======导入====sqoop import --connect jdbc:mysql://20.12.20.165:3306/luo0907 --username root --password 12345 --table aa01 --fields-terminated-by ‘\t‘ -m 1 --hive-importsqoop import --connect jdbc:mysql://20.12.20.165:3306/luo0907 --username root --password 12345 --table aa01 --fields-terminated-by ‘\t‘ -m 1 --hive-import --hive-overwrite --create-hive-table --hive-table luo0908.aa01 --delete-t...

第126讲：Hadoop集群管理之Datanode目录元数据结构详解学习笔记

第126讲：Hadoop集群管理之Datanode目录元数据结构详解学习笔记namenode是管理hdfs文件系统的元数据datanode是负责当前节点上的数据的管理，具体目录内容是在初始阶段自动创建的。在用hdfs dfs namenode format时并没有对datanode进行format。在datanode中目录是按文件信息存储的。datanode存在于具体节点上的hadoop-2.6.0/dfs/data/current中。datanode的VERSION内容与namenode的VERSION内容相似。storageID：在namenode与datanod...

Spark学习笔记-hadoop命令【代码】

进入 $HADOOP/bin一.文件操作文件操作类似于正常的linux操作前面加上“hdfs dfs -”前缀也可以写成hadoop而不用hdfs,但终端中显示Use of this script to execute hdfs command is deprecated.Instead use the hdfs command for it.1.创建目录：(注意文件夹需一级一级创建)hdfs dfs -mkdir /userhdfs dfs -mkdir /user/comhdfs dfs -mkdir /user/com/evor2.删除文件目录hdfs dfs -rm -r /user/com/evor （-rmr也可以）删除文件夹...

C# Hadoop学习笔记（七）—C#的云计算框架借鉴（下）【图】

转自：http://blog.csdn.net/black0707/article/details/12853049 在上篇里，我们主要讨论了，这个系统怎样处理大数据的“读”操作，当然还有一些细节没有讲述。下篇，我们将主要讲述，“写”操作是如何被处理的。我们都知道，如果只有“读”，那几乎是不用做任何数据同步的，也不会有并发安全问题，之所以，会产生这样那样的问题，会导致缓存和数据库的数据不一致，其实根源就在于“写”操作的存在。下面，让我们看一看，当系统需...

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook 使用 Oracle Load For Hadoop（OLH）实...Hadoop基础知识 windows部署hadoop-2.7.0 你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop学习笔记之HBase应用场景

Hadoop学习笔记之HBase应用场景

内容导读

内容图文

内容总结

内容备注

内容手机端

【Hadoop学习笔记之HBase应用场景】教程文章相关的互联网学习教程文章

Hadoop学习笔记（一）—hadoop2.5.2+zookeeper3.6.4+centosx64+vmware11环境搭建【代码】【图】

Hadoop学习笔记(3)——分布式环境搭建【图】

Hadoop源码学习笔记之NameNode启动流程分析二：http server启动源码剖析【代码】【图】

Hadoop学习笔记—17.Hive框架学习【图】

Hadoop 学习笔记1【图】

Hadoop学习笔记之Hadoop伪分布式环境搭建

Hadoop学习笔记（三）——zookeeper的一致性协议：ZAB

hadoop学习笔记

hadoop1.0.3学习笔记【代码】【图】

hadoop学习笔记2---hadoop的三种运行模式

Hadoop学习笔记0002——HDFS文件操作

hadoop-sqoop学习笔记

第126讲：Hadoop集群管理之Datanode目录元数据结构详解学习笔记

Spark学习笔记-hadoop命令【代码】

C# Hadoop学习笔记（七）—C#的云计算框架借鉴（下）【图】

HADOOP - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程