首页 / HBASE / 熟悉常用的HBase操作，编写MapReduce作业

熟悉常用的HBase操作，编写MapReduce作业

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了熟悉常用的HBase操作，编写MapReduce作业，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2157字，纯文字阅读大概需要4分钟。

内容图文

1. 以下关系型数据库中的表和数据，要求将其转换为适合于HBase存储的表并插入数据：

学生表（Student）（不包括最后一列）

学号（S_No）	姓名（S_Name）	性别（S_Sex）	年龄（S_Age）	课程（course）
2015001	Zhangsan	male	23
2015003	Mary	female	22
2015003	Lisi	male	24	数学（Math）85

流程：1.开启dfs和hbase

技术分享图片

验证是否成功开启

技术分享图片

创建表，但是因为我在shell命令写的时候总会卡死，之后进程就直接被杀死了，所以下面我自己手写

技术分享图片

2. 用Hadoop提供的HBase Shell命令完成相同任务：

列出HBase所有的表的相关信息；list
```
hbase(main):008:0>list
```
在终端打印出学生表的所有记录数据；
```
hbase(main):009:0>scan ‘student‘
```
向学生表添加课程列族；

hbase(main):010:0>alter ‘student‘,{NAME=>‘course‘,VERSIONS=>3}

向课程列族添加数学列并登记成绩为85；

                    ‘
                    hbase(main):011:0>put 
                    ‘student‘,‘2015003;‘,‘course:Math‘,‘85‘

删除课程列；
```
disable ‘student‘
```
统计表的行数；count ‘s1‘
```
count ‘student‘
```
清空指定的表的所有记录数据；truncate ‘s1‘

truncate ‘student‘

3. 用Python编写WordCount程序任务

程序	WordCount
输入	一个包含大量单词的文本文件
输出	文件中每个单词及其出现次数（频数），并按照单词字母顺序排序，每个单词和其频数占一行，单词和频数之间有间隔

编写map函数，reduce函数
将其权限作出相应修改
本机上测试运行代码
放到HDFS上运行
下载并上传文件到hdfs上
用Hadoop Streaming命令提交任务

流程：

1.创建mapper.py文件

cd /home/hadoop/wc
sudo gedit mapper.py

2.map函数

            #
            !/usr/bin/env python
            import
             sys

            for i in stdin:
    i = i.strip()
    words = i.split()
    for word in words:
    print‘%s\t%s‘ % (word,1)

3.reduce函数

            #
            !/usr/bin/env python
            from operator import itemgetter
import sys

current_word = None
current_count = 0
word = None

for i in stdin:
    i = i.strip()
    word, count = i.split(‘\t‘,1)
    try:
    count = int(count)
    except ValueError:
    continueif current_word == word:
    current_count += count 
    else:
    if current_word:
        print‘%s\t%s‘ % (current_word, current_count)
    current_count = count
    current_word = word

if current_word == word:
    print‘%s\t%s‘ % (current_word, current_count)

4.创造reduce.py文件

cd /home/hadoop/wc
sudo gedit reducer.py

5.赋予权限及测试代码

chmod a+x /home/hadoop/mapper.py

echo "foo foo quux labs foo bar quux" | /home/hadoop/wc/mapper.py

echo "foo foo quux labs foo bar quux" | /home/hadoop/wc/mapper.py | sort -k1,1 | /home/hadoop/wc/reducer.p

6.下载文件上传

            #
            上传
cd  /home/hadoop/wc
wget http://www.gutenberg.org/files/5000/5000-8.txt
wget http://www.gutenberg.org/cache/epub/20417/pg20417.txt

#下载
cd /usr/hadoop/wc
hdfs dfs -put /home/hadoop/hadoop/gutenberg/*.txt /user/hadoop/input

以上在第七章PPT都有所描述。

原文：https://www.cnblogs.com/tiankongyiluozhiwu/p/9009982.html

内容总结

以上是互联网集市为您收集整理的熟悉常用的HBase操作，编写MapReduce作业全部内容，希望文章能够帮你解决熟悉常用的HBase操作，编写MapReduce作业所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1291660.html

来源：【匿名】

首页 / HBASE / 熟悉常用的HBase操作，编写MapReduce作业

熟悉常用的HBase操作，编写MapReduce作业

内容导读

内容图文

内容总结

内容备注

内容手机端

【熟悉常用的HBase操作，编写MapReduce作业】教程文章相关的互联网学习教程文章

java – 尝试运行HBase map reduce时出错【代码】

MAP - 相关标签

HBASE - 最新教程

HBASE - 最热教程