首页 / HADOOP / Hadoop2.0YARNcloudra4.4.0WordCount实例

Hadoop2.0YARNcloudra4.4.0WordCount实例

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop2.0YARNcloudra4.4.0WordCount实例，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3279字，纯文字阅读大概需要5分钟。

内容图文

Hadoop2.0YARNcloudra4.4.0WordCount实例 - 文章图片

其他都没啥这个 jar都在这里了。

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

public class WordCount {

  public static class TokenizerMapper 
       extends Mapper<Object, Text, Text, IntWritable>{
    
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();
      
    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }
  
  public static class IntSumReducer 
       extends Reducer<Text,IntWritable,Text,IntWritable> {
    private IntWritable result = new IntWritable();

    public void reduce(Text key, Iterable values, 
                       Context context
                       ) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }

  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
    if (otherArgs.length != 2) {
      System.err.println("Usage: wordcount  ");
      System.exit(2);
    }
    Job job = new Job(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
    FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);
  }
}

导出为Jar包，上传（发现这个版本居然不知道怎么在Eclipse里直接跑，只好上传了）

Hadoop2.0YARNcloudra4.4.0WordCount实例 - 文章图片

./hadoop jar ../etc/hadoop/WordCount.jar /user/hadoop/input /user/hadoop/output

input里是yard02的etc/profile文件

结果：

!=	1
"$BASH"	2
"$PS1"	1
"/bin/sh"	1
"`id	1
#	6
$i	2
&&	1
'	3
(bash(1),	1
(sh(1))	1
-d	1
-eq	1
-f	1
-r	1
-u`"	1
.	2
...).	1
.profile	1
/etc/bash.bashrc	2
/etc/login.defs.	1
/etc/profile.d	1
/etc/profile.d/*.sh;	1
/etc/profile:	1
0	1
Bourne	2
CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH	1
JAVA_HOME=/usr/local/jdk1.7.0_21	1
JRE_HOME=/usr/local/jdk1.7.0_21/jre	1
PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH	1
PS1.	1
PS1='#	1
PS1='$	1
PS1='\h:\w\$	1
See	1
The	2
[	7
]	1
];	6
already	1
and	2
ash(1),	1
bash.bashrc	1
by	1
compatible	1
default	2
do	1
done	1
else	2
export	4
fi	6
file	2
for	2
handled	1
i	2
if	6
in	1
is	1
ksh(1),	1
now	1
pam_umask(8)	1
pam_umask.	1
sets	1
shell	1
shells	1
system-wide	1
the	2
then	6
umask	1
unset	1

内容总结

以上是互联网集市为您收集整理的Hadoop2.0YARNcloudra4.4.0WordCount实例全部内容，希望文章能够帮你解决Hadoop2.0YARNcloudra4.4.0WordCount实例所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/564831.html

来源：【匿名】

【上一篇】Hadoop2.2.0Eclipse插件使用【下一篇】php能用hadoop吗

更多 ►

【Hadoop2.0YARNcloudra4.4.0WordCount实例】教程文章相关的互联网学习教程文章

Hadoop入门程序WordCount的执行过程【代码】【图】

首先编写WordCount.java源文件，分别通过map和reduce方法统计文本中每个单词出现的次数，然后按照字母的顺序排列输出，　　Map过程首先是多个map并行提取多个句子里面的单词然后分别列出来每个单词，出现次数为1，全部列举出来　　Reduce过程首先将相同key的数据进行查找分组然后合并，比如对于key为Hello的数据分组为：<Hello, 1>、<Hello,1>、<Hello,1>，合并之后就是<Hello,1+1+1>，分组也可以理解为reduce的操作，合并减少数据...

Java笔记---Hadoop 2.7.1下WordCount程序详解【代码】【图】

一、前言在之前我们已经在 CenOS6.5 下搭建好了 Hadoop2.x 的开发环境。既然环境已经搭建好了，那么现在我们就应该来干点正事嘛！比如来一个Hadoop世界的HelloWorld，也就是WordCount程序(一个简单的单词计数程序)二、WordCount 官方案例的运行2.1 程序简介WordCount程序是hadoop自带的案例，我们可以在 hadoop 解压目录下找到包含这个程序的 jar 文件(hadoop-mapreduce-examples-2.7.1.jar)，该文件所在路径为 hadoop/share/hadoo...

hadoop自带例子wordcount的具体运行步骤

1.在hadoop所在目录“usr/local”下创建一个文件夹inputroot@ubuntu:/usr/local# mkdir input2.在文件夹input中创建两个文本文件file1.txt和file2.txt，file1.txt中内容是“hello word”,file2.txt中内容是“hello hadoop”、“hello mapreduce”(分两行)。root@ubuntu:/usr/local# cd inputroot@ubuntu:/usr/local/input# echo "hello word" > file1.txtroot@ubuntu:/usr/local/input# echo "hello hadoop" > file2.txtroot@ub...

hadoop wordcount异常

最近学习hadoop，在windows+eclipse+虚拟机hadoop集群环境下运行mapreduce程序遇到了很多问题。上网查了查，并经过自己的分析，最终解决，在此分享一下，给遇到同样问题的人提供参考。我的hadoop集群环境：虚拟机上4台机器：192.168.137.111（master）、192.168.137.112（slave1）、192.168.137.113（slave2）、192.168.137.114（slave3）hadoop集群用户名：hadoophadoop版本：hadoop-1.1.2开发环境：windows7+eclipse+hadoop插件异...

hadoop伪分布式之配置yarn并运行MR程序（WordCount）【代码】【图】

1、配置集群（1）在yarn-env.sh中配置JAVA_HOMEexport JAVA_HOME=/opt/module/jdk1.8.0_11（2）在yarn-site.xml中配置<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.resourcemanager.hostname</name><value>hadoop01</value></property>（3）配置mapred-env.shexport JAVA_HOME=/opt...

hadoop的统计单词程序WordCount提示找不到WordCount类【代码】

按这里的教程： http://www.imooc.com/learn/391 试验时，发现在wordcount的最后一步一直提示如下错误：Exception in thread "main" java.lang.ClassNotFoundException:WordCountat java.net.URLClassLoader$1.run(URLClassLoader.java:366)at java.net.URLClassLoader$1.run(URLClassLoader.java:355)at java.security.AccessController.doPrivileged(Native Method)at java.net.URLClassLoader.findClass(URLClassLoader.java:35...

hadoop的wordcount的改动版

//这个是在原来的基础上改动以后得到的，将当中的分词的根据给换掉了，而且进行词频统计的时候会自己主动的忽略大写和小写 packageorg.apache.hadoop.mapred; importjava.io.IOException;importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;importjava.util.StringTokenizer; importorg.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configured;importorg.apache.hadoop.fs.Path;impor...

hadoop学习（六）WordCount示例深度学习MapReduce过程（1）

花了整整一个下午（6个多小时），整理总结，也算是对这方面有一个深度的了解。日后可以回头多看看。我们都安装完Hadoop之后，按照一些案例先要跑一个WourdCount程序，来测试Hadoop安装是否成功。在终端中用命令创建一个文件夹，简单的向两个文件中各写入一花了整整一个下午（6个多小时），整理总结，也算是对这方面有一个深度的了解。日后可以回头多看看。我们都安装完Hadoop之后，按照一些案例先要跑一个WourdCount程序，...

Hadoop中运行WordCount【图】

上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境，今天介绍如何运行Hadoop环境下的第一个实例WordCount。在伪分布模式下运行一下hadoop自带的例子WordCount来感受以下MapReduce过程：这时注意程序是在文件系统dfs运行的，创建的文件上一篇文章搭建Hadoop环境的详细过程中已经详细介绍了如何搭建Hadoop环境，今天介绍如何运行Hadoop环境下的第一个实例WordCount。在伪分布模式下运行一下hadoop自带的例子W...

hadoopwordcount新API例子

准备准备一些输入文件，可以用hdfs dfs -put xxx/*?/user/fatkun/input上传文件代码 package com.fatkun;?import java.io.IOException;import java.util.ArrayList;import java.util.List;import java.util.StringTokenizer;?import org.apache.commons.lo准备准备一些输入文件，可以用hdfs dfs -put xxx/*?/user/fatkun/input上传文件代码 package com.fatkun; ? import java.io.IOException; import java.util.ArrayList; im...

hadoop第一个程序WordCount.java的编译运行过程

java是hadoop开发的标准官方语言，本文下载了官方的WordCount.java并对其进行了编译和打包，然后使用测试数据运行了该hadoop程序。这里假定已经装好了hadoop的环境，在Linux下运行hadoop命令能够正常执行；下载java版本的WordCount.java程序。将WordCountjava是hadoop开发的标准官方语言，本文下载了官方的WordCount.java并对其进行了编译和打包，然后使用测试数据运行了该hadoop程序。这里假定已经装好了hadoop的环境，在Linux...

fedora17中hadoop2.2.0在eclipse下运行wordcount

hadoop2.2.0的eclipse插件在http://download.csdn.net/detail/acm_er6/6964345 ，下载后直接拷贝到/usr/lib/eclipse/plugins/目录下然后重启eclipse后如果eclipse右边出现一头hadoop标志的小象即说明插件安装成功。然后窗口—首选项，选择Hadoop Map/Reducehadoop2.2.0的eclipse插件在http://download.csdn.net/detail/acm_er6/6964345 ，下载后直接拷贝到/usr/lib/eclipse/plugins/目录下然后重启eclipse后如果eclipse右边出现一头...

hadoop学习（七）WordCount+Block+Split+Shuffle+Map+Reduce技术【图】

纯干活：通过WourdCount程序示例：详细讲解MapReduce之BlockSplitShuffleMapReduce的区别及数据处理流程。 Shuffle过程是MapReduce的核心，集中了MR过程最关键的部分。要想了解MR，Shuffle是必须要理解的。了解Shuffle的过程，更有利于我们在对MapReduce job纯干活：通过WourdCount程序示例：详细讲解MapReduce之Block+Split+Shuffle+Map+Reduce的区别及数据处理流程。Shuffle过程是MapReduce的核心，集中了MR过程最关键的部分。要...

Hadoop2.0YARNcloudra4.4.0WordCount实例【图】

其他都没啥这个 jar都在这里了。 import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Te 其他都没啥这个 jar都在这里了。 import java.io.IOException; import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration; import org.apache.had...

hadoop之配置yarn并运行MR程序（WordCount）【代码】【图】

1、配置集群（1）在yarn-env.sh中配置JAVA_HOME export JAVA_HOME=/opt/module/jdk1.8.0_11 （2）在yarn-site.xml中配置 <property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value> </property>  <property><name>yarn.resourcemanager.hostname</name><value>hadoop01</value> </property>（3）配置mapred-env.sh export JAVA_...

首页 / HADOOP / Hadoop2.0YARNcloudra4.4.0WordCount实例

Hadoop2.0YARNcloudra4.4.0WordCount实例

内容导读

内容图文

内容总结

内容备注

内容手机端

【Hadoop2.0YARNcloudra4.4.0WordCount实例】教程文章相关的互联网学习教程文章

WORD - 相关标签

实例 - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程