首页 / HADOOP / eclipse中开发Hadoop2.x的Map/Reduce项目

eclipse中开发Hadoop2.x的Map/Reduce项目

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了eclipse中开发Hadoop2.x的Map/Reduce项目，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4822字，纯文字阅读大概需要7分钟。

内容图文

本文演示如何在Eclipse中开发一个Map/Reduce项目： 1、环境说明

Hadoop2.2.0
Eclipse?Juno SR2
Hadoop2.x-eclipse-plugin 插件的编译安装配置的过程参考：http://www.micmiu.com/bigdata/hadoop/hadoop2-x-eclipse-plugin-build-install/

2、新建MR工程 依次点击 File →?New →?Ohter... ?选择 “Map/Reduce Project”，然后输入项目名称:micmiu_MRDemo，创建新项目:

3、创建Mapper和Reducer 依次点击?File →?New →?Ohter... 选择Mapper，自动继承Mapper eclipse中开发Hadoop2.x的Map/Reduce项目 - 文章图片

创建Reducer的过程同Mapper，具体的业务逻辑自己实现即可。本文就以官方自带的WordCount为例进行测试：

package com.micmiu.mr;
/**
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class WordCount {
  public static class TokenizerMapper 
       extends Mapper<Object, Text, Text, IntWritable>{
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();
    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }
  public static class IntSumReducer 
       extends Reducer<Text,IntWritable,Text,IntWritable> {
    private IntWritable result = new IntWritable();
    public void reduce(Text key, Iterable values, 
                       Context context
                       ) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }
  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
    if (otherArgs.length != 2) {
      System.err.println("Usage: wordcount  ");
      System.exit(2);
    }
    //conf.set("fs.defaultFS", "hdfs://192.168.6.77:9000");
    Job job = new Job(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
    FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);
  }
}

4、准备测试数据 micmiu-01.txt：

Hi Michael welcome to Hadoop 
more see micmiu.com

micmiu-02.txt：

Hi Michael welcome to BigData
more see micmiu.com

micmiu-03.txt：

Hi Michael welcome to Spark 
more see micmiu.com

把 micmiu 打头的三个文件上传到hdfs：

micmiu-mbp:Downloads micmiu$ hdfs dfs -copyFromLocal micmiu-*.txt /user/micmiu/test/input
micmiu-mbp:Downloads micmiu$ hdfs dfs -ls /user/micmiu/test/input
Found 3 items
-rw-r--r--   1 micmiu supergroup         50 2014-04-15 14:53 /user/micmiu/test/input/micmiu-01.txt
-rw-r--r--   1 micmiu supergroup         50 2014-04-15 14:53 /user/micmiu/test/input/micmiu-02.txt
-rw-r--r--   1 micmiu supergroup         49 2014-04-15 14:53 /user/micmiu/test/input/micmiu-03.txt
micmiu-mbp:Downloads micmiu$

5、配置运行参数 Run As →?Run Configurations… ，在Arguments中配置运行参数，例如程序的输入参数： eclipse中开发Hadoop2.x的Map/Reduce项目 - 文章图片

6、运行 Run As -> Run on Hadoop ，执行完成后可以看到如下信息：

到此Eclipse中调用Hadoop2x本地伪分布式模式执行MR演示成功。 ps：调用集群环境MR运行一直失败，暂时没有找到原因。 —————– ?EOF?@Michael Sun?—————–

原文地址：eclipse中开发Hadoop2.x的Map/Reduce项目, 感谢原作者分享。

内容总结

以上是互联网集市为您收集整理的eclipse中开发Hadoop2.x的Map/Reduce项目全部内容，希望文章能够帮你解决eclipse中开发Hadoop2.x的Map/Reduce项目所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/556149.html

来源：【匿名】

【上一篇】Hadoop自动化安装及单节点方式运行【下一篇】php能用hadoop吗

更多 ►

【eclipse中开发Hadoop2.x的Map/Reduce项目】教程文章相关的互联网学习教程文章

hadoop eclipse工程构建【代码】

安装jdk 步骤1：从oracle的网站上下载jdk，我下的是jdk-6u45-linux-x64.bin，下载完后放到/usr/lib/jvm目录下 $chmod +x /usr/lib/jvm/jdk-6u45-linux-x64.bin $sudo /usr/lib/jvm/jdk-6u45-linux-x64.bin 之后会出现安装信息步骤2：配置jdk，修改/etc/profile文件，在最后添加下面的内容：export JAVA_HOME=/usr/lib/jvm/jdk1.6.0_45 export JRE_HOME=${JAVA_HOME}/jre export CLASSPATH=.:${JAVA_HOM...

使用hadoop eclipse plugin提交Job并添加多个第三方jar

来自：http://heipark.iteye.com/blog/1171923 通过 "conf.set("tmpjars", jars);" 可以设置第三方jar，之前一直只是添加一个jar，运行OK，今天打算添加多个jar的时候发现mapreduce在运行时找不到 class（ClassNotFoundException），跟踪代码发现jar文件的确上传到了HDFS中，所以甚是无解，后来上传jar到 hdfs，然后使用DistributedCache.addFileToClassPath()方法也不行。郁闷半天，后来看到job.xml中有一段奇怪的设置，mapred.j...

编译eclipse hadoop插件【代码】

操作系统：ubuntuhadoop版本:1.0.1eclipse版本:eclipse Helios-SR2直接通过hadoop 1.0.1掩码插件生成的eclipse插件是不能用的，因为少了一些jar包，所以需要手工修改src/contrib/eclipse-plugin目录下的build.xml文件和META-INF/MANIFEST.MF文件。修改build.xml文件这是没修改前的<target name="jar" depends="compile" unless="skip.contrib"> <mkdir dir="${build.dir}/lib"/> <copy file="${hadoop.root}/build/hadoop-...

win7+eclipse配置Hadoop开发环境注意事项【代码】

1、需把hadoop.dll 和 winutils.exe 放到hadoop的bin目录下，我的是：E:\Hadoop\hadoop-2.4.0\bin2、且需要配置HADOOP_HOME 和 PATH 路径。我的如下： HADOOP_HOME——E:\Hadoop\hadoop-2.4.0 PATH——.;%HADOOP_HOME%\bin;以上两个注意项可以解决运行wordcount报空指针异常的错误。3、需在工程src目录下新建一个log4j.properties文件，不然会有log4j警告提示，如下：log4j:WARN No appenders could be found for logg...

Hadoop2.6.2的Eclipse插件的使用【代码】【图】

欢迎转载，且请注明出处，在文章页面明显位置给出原文连接。本文链接：首先给出eclipse插件的下载地址：http://download.csdn.net/download/zdfjf/94212441.插件的安装插件下载后，放在eclipse安装目录下的plugins文件夹下，然后重启eclipse，就会发现Project Explorer窗口里多出DFS Locations这一项，对应的是HDFS里存放的文件，现在里边还没有显示目录结构，不用着急，第二步配置之后，目录结构就会出现了。我突然想起来博客园上...

Hadoop2.4.0 中Eclipse 平台的搭建【图】

一、Hadoop2.4.0环境下Eclipse平台的搭建1.安装Eclipse 对于hadoop集群，我们将eclipse安装在master节点上，首先下载Eclipse安装包（如：eclipse-jee-luna-SR1-linux-gtk.tar.gz)然后用tar -zxvf 命令解压，并把解压后的目录移动到/usr/local路径下，然后启动eclipse:下载网址：http://www.eclipse.org/downloads/?osType=linux&release=undefined 2.在eclipse上安装hadoop插件由于我们使用的是hadoop2.x版本的，所以插件...

使用Eclipse运行Hadoop 2.x MapReduce程序常见问题【图】

1、当我们编写好MapReduce程序，点击Run on Hadoop的时候，Eclipse控制台输出如下内容：这个信息告诉我们没有找到log4j.properties文件。如果没有这个文件，程序运行出错的时候，就没有打印日志，因此我们会很难调试。解决方法：复制$HADOOP_HOME/etc/hadoop/目录下的log4j.properties文件到MapReduce项目 src文件夹下。 2、当执行MapReduce程序的时候，Eclipse可能会报告堆益处的错误。此时，MapReduce程序执行的out目录已...

安装Hadoop系列 — eclipse plugin插件编译安装配置【图】

[一]、环境参数 eclipse-java-kepler-SR2-linux-gtk-x86_64.tar.gz //现在改为eclipse-jee-kepler-SR2-linux-gtk-x86_64.tar.gzHadoop1.0.3Java 1.8.0Ubuntu 12.04 64bit[二]、安装配置1、复制生成的 hadoop-eclipse-plugin-1.0.3.jar 到 eclipse/plugins 路径下,重启eclipse即可。2、在eclipse菜单依次点击 windows → show view → other… ，选择“Show View”对话框打开，搜索框输入“map”，会找到项“Map/Reduce Locations...

2.1 Hadoop Eclipse Plugin 配置及安装

Hadoop Eclipse 开发工具主要分为1、根据Hadoop版本生成插件 2、安装Hadoop Eclipse插件 3、配置Hadoop目录 4、配置Hadoop连接 5、新一个MapReduce工程 WordCount.javaMapReduce——WordCount问题总结参考：http://blog.sina.com.cn/s/blog_7fcb1aef0100zpux.html正成功输入出后信息:14/05/21 23:06:47 INFO input.FileInputFormat: Total input paths to process : 214/05/21 23:06:47 WARN util.NativeCodeLoader: Unable to ...

编译hadoop-eclipse-plugins-1.2.1插件步骤

a. 在hadoop解压目录下，找到src\contrib\eclipse-plugin\build.xml，增加如下几行：<filesetdir="${hadoop.root}"> <includename="hadoop*.jar"/></fileset> b. 在build.xml增加如下：<property name="version"value="1.2.1"/> c. 在build.xml，修改如下：<copy file="${hadoop.root}/hadoop-core-${version}.jar"tofile="${build.dir}/lib/hadoop-core.jar"ve...

（亲测）eclipse远程访问hadoop【代码】

1.环境：　hadoop 2.6.0　jdk 1.7x64　centos7 eclipse j2ee 2.安装hadoop　　1.关闭防火墙　　centos7.0以上使用此命令　　systemctl start firewalld.service #临时关闭　　systemctl disable firewalld.service #关闭开机启动　　centos7.0以下使用此命令　　service iptables stop #临时关闭　　chkconfig iptables off #关闭开机启动　　2.修改主机名　　vi /etc/hosts　　去除其他所有的hosts信息，插入下面的hosts10.0.1....

用Eclipse跑Hadoop程序的注意事项

Hadoop程序的MR模式可以提供并行化运行环境，而HDFS是并行化的基础（HDFS毕竟把文件分割了，而local只是存在一台机器上），所以，如何在eclipse上跑程序，让其读取HDFS上的文件，是一个关键。一般来说，你要通过设置configuration来设置目录是hdfs还是local，如果你不设置，默认就是local，此时你如果把hdfs-site.xml放入eclipse建的工程的话，那么，跑的程序就会在HDFS上了，因为那个xml配置了程序默认的运行目录，清楚了如何在HD...

Hadoop on Windows with Eclipse -01- Introduction

IntroductionHadoop is a powerful framework for automatic parallelization of computing tasks. Unfortunately programming for it poses certain challenges. It is really hard to understand and debug Hadoop programs. One way to make it a little easier is to have a simplified version of the Hadoop cluster that runs locally on the developer‘s machine. This tutorial describes how to set up such a cluster ...

hadoop 2.7.2 (hadoop2.x)使用ant制作eclipse插件hadoop-eclipse-plugin-2.7.2.jar【图】

之前介绍了我在Ubuntu下组合虚拟机Centos6.4搭建hadoop2.7.2集群,为了做mapreduce开发,要使用eclipse,并且需要对应的hadoop插件hadoop-eclipse-plugin-2.7.2.jar,首先说明一下,在hadoop1.x之前官方hadoop安装包中都自带有eclipse的插件,而如今随着程序员的开发工具eclipse版本的增多和差异,hadoop插件也必须要和开发工具匹配,hadoop的插件包也不可能全部兼容.为了简化,如今的hadoop安装包内不会含有eclipse的插件.需要各自根据自己...