首页 / ECLIPSE / Windows下Eclipse连接hadoop

Windows下Eclipse连接hadoop

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Windows下Eclipse连接hadoop，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5875字，纯文字阅读大概需要9分钟。

内容图文

2015-3-27

参考：

http://www.cnblogs.com/baixl/p/4154429.html

http://blog.csdn.net/u010911997/article/details/44099165

============================================

hadoop在虚拟机上（远程连接也是一样只需要知道master的ip和core-site.xml配置即可。

Vmware上搭建了hadoop分布式平台：

192.168.47.133 master

192.168.47.134 slave1

192.168.47.135 slave2

core-site.xml 配置文件：

<property>
　　<name>fs.defaultFS</name>
　　<value>hdfs://master:9000</value>
　　<description>The name of the default file system.</description>
</property>

1 下载插件

hadoop-eclipse-plugin-2.6.0.jar

github上下载源码后需要自己编译。这里使用已经编译好的插件即可

2 配置插件

把插件放到..\eclipse\plugins目录下，重启eclipse，配置Hadoop installation directory ，

如果插件安装成功，打开Windows—Preferences后，在窗口左侧会有Hadoop Map/Reduce选项，点击此选项，在窗口右侧设置Hadoop安装路径。（windows下只需把hadoop-2.5.1.tar.gz解压到指定目录）

技术分享

3 配置Map/Reduce Locations

打开Windows—Open Perspective—Other，选择Map/Reduce，点击OK，控制台会出现：

技术分享

右键 new Hadoop location 配置hadoop：输入

Location Name，任意名称即可.

配置Map/Reduce Master和DFS Mastrer，Host和Port配置成与core-site.xml的设置一致即可。

技术分享

点击"Finish"按钮，关闭窗口。

点击左侧的DFSLocations—>master （上一步配置的location name)，如能看到user，表示安装成功

技术分享

4 wordcount实例

File—>Project，选择Map/Reduce Project，输入项目名称WordCount等。在WordCount项目里新建class，名称为WordCount，代码如下：

import java.io.IOException;

import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.util.GenericOptionsParser;

public class WordCount {

public static class TokenizerMapper extendsMapper<Object,Text,Text,IntWritable>{

private final static IntWritable one=new IntWritable(1);

private Text word =new Text();

public void map(Object key,Text value,Context context) throwsIOException,InterruptedException{

StringTokenizer itr=new StringTokenizer(value.toString());

while (itr.hasMoreTokens()) {

word.set(itr.nextToken());

context.write(word, one);

}

public static class IntSumReducer extendsReducer<Text,IntWritable,Text,IntWritable> {

private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,Contextcontext) throws IOException, InterruptedException {

int sum = 0;

for (IntWritable val : values) {

sum += val.get();

}

result.set(sum);

context.write(key, result);

}

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

Job job = new Job(conf, "word count");

job.setJarByClass(WordCount.class);

job.setMapperClass(TokenizerMapper.class);

job.setCombinerClass(IntSumReducer.class);

job.setReducerClass(IntSumReducer.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

FileInputFormat.addInputPath(job, newPath("hdfs://192.168.11.134:9000/in/test*.txt"));//路径1

FileOutputFormat.setOutputPath(job, newPath("hdfs://192.168.11.134:9000/output"));//输出路径

System.exit(job.waitForCompletion(true) ? 0 : 1);

}

上面的路径1 和路径2 由于在代码中已经定义，这不需要在配置文件中定义，若上面路径1和路径2 代码为：

FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

这需要配置运行路径：类右键 Run As—>Run Configurations

技术分享

红色部分为配置的hdfs上文件路径，

点击run 或或者：Run on Hadoop，运行结果会显示在DFS Locations。若运行中有更新，右键DFS Locations，点disconnect更新

运行结果：

技术分享

5 问题及解决办法

5.1 出现空指针异常：

1 在Hadoop的bin目录下放winutils.exe，

2 在环境变量中配置 HADOOP_HOME，

3 hadoop.dll拷贝到C:\Windows\System32下面即可

下载地址：

http://mail-archives.apache.org/mod_mbox/incubator-slider-commits/201411.mbox/%3Ce263738846864bfda0dd6c17a7457988@git.apache.org%3E

http://git-wip-us.apache.org/repos/asf/incubator-slider/blob/29483696/bin/windows/hadoop-2.6.0-SNAPSHOT/bin/winutils.exe

http://git-wip-us.apache.org/repos/asf/incubator-slider/blob/29483696/bin/windows/hadoop-2.6.0-SNAPSHOT/bin/hadoop.dll

问题1：在DFS Lcation 上不能多文件进行操作：

在hadoop上的每个节点上修改该文件 conf/mapred-site.xml

增加：

<name>dfs.permissions</name>

<value>false</value>

</property>

关闭权限验证

问题2

log4j:WARN No appenders could be foundfor logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory).

log4j:WARN Please initialize the log4jsystem properly.

log4j:WARN Seehttp://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

在src文件夹下创建以log4j.properties命名的文件

文件内容如下

log4j.rootLogger=WARN, stdout

log4j.appender.stdout=org.apache.log4j.ConsoleAppender

log4j.appender.stdout.layout=org.apache.log4j.PatternLayout

log4j.appender.stdout.layout.ConversionPattern=%d%p [%c] - %m%n

问题3

java.io.IOException: Could not locateexecutable null/bin/winutils.exe in the Hadoop binaries.

缺少winutils.exe 下载一个添加进去就行

下载地址 http://download.csdn.net/detail/u010911997/8478049

问题4

Exceptionin thread "main" java.lang.UnsatisfiedLinkError:org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSumsByteArray(II[BI[BIILjava/lang/String;JZ)V

这是由于hadoop.dll 版本问题，2.4之前的和自后的需要的不一样

需要选择正确的版本并且在 Hadoop/bin和 C：\windows\system32 上将其替换

问题5

Exception in thread "main"java.lang.UnsatisfiedLinkError:org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

atorg.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Native Method)

at org.apache.hadoop.io.nativeio.NativeIO$Windows.access(NativeIO.java:557)

目前未找到解决方法，只能修改源代码

源代码下载 http://pan.baidu.com/s/1jGJzVSy

将源代码放入工程的src目录下并创建同样的包名，然后修改源代码

源代码未修改前

publicstaticbooleanaccess(String path, AccessRight desiredAccess)

throws IOException {

return access0(path,desiredAccess.accessRight());

}

源代码修改后

public staticbooleanaccess(String path, AccessRight desiredAccess)

throws IOException {

return ture;

// return access0(path,desiredAccess.accessRight());

}

修改后编译成功，但是看不到软件运行时候的信息反馈

原文：http://www.cnblogs.com/marost/p/4372778.html

内容总结

以上是互联网集市为您收集整理的Windows下Eclipse连接hadoop全部内容，希望文章能够帮你解决Windows下Eclipse连接hadoop所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1250595.html

来源：【匿名】

【下一篇】zendstudio中文版使用zendstudioforeclipse不能激活代码提示功能的解决办法

更多 ►

【Windows下Eclipse连接hadoop】教程文章相关的互联网学习教程文章

Windows下Eclipse连接hadoop【代码】【图】

2015-3-27参考：http://www.cnblogs.com/baixl/p/4154429.htmlhttp://blog.csdn.net/u010911997/article/details/44099165============================================hadoop在虚拟机上（远程连接也是一样只需要知道master的ip和core-site.xml配置即可。Vmware上搭建了hadoop分布式平台：192.168.47.133 master192.168.47.134 slave1192.168.47.135 slave2 core-site.xml 配置文件：<property><name>fs.defaultFS</name><value>h...

win系统下的eclipse连接和使用linux上的hadoop集群【图】

准备工作先在win系统的hosts文件里添加以下内容 10.61.6.164master //hadoop集群的master节点一、首先在eclipse上安装hadoop插件下载hadoop-eclipse-plugin-1.1.2.jar，将其拷贝到eclipse 安装目录下的plugins，再启动eclispe，这时在eclipse的File/New/other下会看到一下的内容，证明插件安装成功二、在Window/show view/other里打开Map/Reduce Locations 打开后会有下图所示的窗口，点击右侧的紫色小象会弹出下图所示的...

Eclipse查看hadoop源代码出现Source not found,是因为没有添加.zip【图】

在我们hadoop编程中，经常遇到像看看hadoop的某个类中函数的功能。但是我们会遇到一种情况就是Source not found。遇到这个问题，该如何解决。因为我们已经引入了包，为什么会找不到。如果不了解怎么引入的可以参考：hadoop开发方式总结及操作指导http://www.aboutyun.com/thread-6950-1-1.html看到上面现象，是因为我们每天添加.zip。该如何添加zip包。那么我们从哪去找zip包。（1）解压hadoop-2.7.3-src.tar.gz得到文件夹hadoop-2...

Eclipse Hadoop源码阅读环境

一、解压hadoop src包到workspace目录二、File->Import->Existing Maven Projects，在Root Directory处选择解压好的目录，Finish三、等待maven把依赖包下载好后，会出现一些问题，下面是重头戏。四、maven问题解决（1）若发现maven依赖包找不见，找到位置后删除jar包目录，然后右击工程，Alt+F5，确认后会自动下载。不要手动下载第三方包，可能不识别（2）报 maven-resources-plugin prior to 2.4 is not supported by m2e，Windio...

如何通过eclipse查看、阅读hadoop2.4源码【图】

问题导读：1.官网src包下载包，能否直接使用？2.如何跟踪和查看hadoop源码？此篇是从零教你如何获取hadoop2.4源码并使用eclipse关联hadoop2.4源码基础上的一个继续，上文其实已经把源代码下载下来了。下载之后，我们如何查看源码代码。我们还是通过eclipse的导入功能，这里简略描述一下，详细可以查看零基础教你如何导入Java项目到eclipse中。1.导入查看hadoop源码（1）选择Existing Projects into Workspace<ignore_js_op> （2）选...

Centos下装eclipse测试Hadoop【代码】【图】

(一)，安装eclipse　　　1，下载eclipse，点这里　　　2，将文件上传到Centos7,可以用WinSCP　　　3，解压并安装eclipse　　　　　　　　[root@Master opt]# tar zxvf ‘/home/s/eclipse-jee-neon-1a-linux-gtk-x86_64.tar.gz‘ -C/opt　　---------------> 建立文件：[root@Master opt]# mkdir /usr/bin/eclipse ------------------》添加链接，即快捷方式：[root@Master opt]# ln -s /opt/eclipse/eclipse /usr/bin/eclipse ...

hadoop eclipse工程构建【代码】

安装jdk 步骤1：从oracle的网站上下载jdk，我下的是jdk-6u45-linux-x64.bin，下载完后放到/usr/lib/jvm目录下 $chmod +x /usr/lib/jvm/jdk-6u45-linux-x64.bin $sudo /usr/lib/jvm/jdk-6u45-linux-x64.bin 之后会出现安装信息步骤2：配置jdk，修改/etc/profile文件，在最后添加下面的内容：export JAVA_HOME=/usr/lib/jvm/jdk1.6.0_45 export JRE_HOME=${JAVA_HOME}/jre export CLASSPATH=.:${JAVA_HOM...

使用hadoop eclipse plugin提交Job并添加多个第三方jar

来自：http://heipark.iteye.com/blog/1171923 通过 "conf.set("tmpjars", jars);" 可以设置第三方jar，之前一直只是添加一个jar，运行OK，今天打算添加多个jar的时候发现mapreduce在运行时找不到 class（ClassNotFoundException），跟踪代码发现jar文件的确上传到了HDFS中，所以甚是无解，后来上传jar到 hdfs，然后使用DistributedCache.addFileToClassPath()方法也不行。郁闷半天，后来看到job.xml中有一段奇怪的设置，mapred.j...

编译eclipse hadoop插件【代码】

操作系统：ubuntuhadoop版本:1.0.1eclipse版本:eclipse Helios-SR2直接通过hadoop 1.0.1掩码插件生成的eclipse插件是不能用的，因为少了一些jar包，所以需要手工修改src/contrib/eclipse-plugin目录下的build.xml文件和META-INF/MANIFEST.MF文件。修改build.xml文件这是没修改前的<target name="jar" depends="compile" unless="skip.contrib"> <mkdir dir="${build.dir}/lib"/> <copy file="${hadoop.root}/build/hadoop-...

win7+eclipse配置Hadoop开发环境注意事项【代码】

1、需把hadoop.dll 和 winutils.exe 放到hadoop的bin目录下，我的是：E:\Hadoop\hadoop-2.4.0\bin2、且需要配置HADOOP_HOME 和 PATH 路径。我的如下： HADOOP_HOME——E:\Hadoop\hadoop-2.4.0 PATH——.;%HADOOP_HOME%\bin;以上两个注意项可以解决运行wordcount报空指针异常的错误。3、需在工程src目录下新建一个log4j.properties文件，不然会有log4j警告提示，如下：log4j:WARN No appenders could be found for logg...

Hadoop2.6.2的Eclipse插件的使用【代码】【图】

欢迎转载，且请注明出处，在文章页面明显位置给出原文连接。本文链接：首先给出eclipse插件的下载地址：http://download.csdn.net/download/zdfjf/94212441.插件的安装插件下载后，放在eclipse安装目录下的plugins文件夹下，然后重启eclipse，就会发现Project Explorer窗口里多出DFS Locations这一项，对应的是HDFS里存放的文件，现在里边还没有显示目录结构，不用着急，第二步配置之后，目录结构就会出现了。我突然想起来博客园上...

Hadoop2.4.0 中Eclipse 平台的搭建【图】

一、Hadoop2.4.0环境下Eclipse平台的搭建1.安装Eclipse 对于hadoop集群，我们将eclipse安装在master节点上，首先下载Eclipse安装包（如：eclipse-jee-luna-SR1-linux-gtk.tar.gz)然后用tar -zxvf 命令解压，并把解压后的目录移动到/usr/local路径下，然后启动eclipse:下载网址：http://www.eclipse.org/downloads/?osType=linux&release=undefined 2.在eclipse上安装hadoop插件由于我们使用的是hadoop2.x版本的，所以插件...

使用Eclipse运行Hadoop 2.x MapReduce程序常见问题【图】

1、当我们编写好MapReduce程序，点击Run on Hadoop的时候，Eclipse控制台输出如下内容：这个信息告诉我们没有找到log4j.properties文件。如果没有这个文件，程序运行出错的时候，就没有打印日志，因此我们会很难调试。解决方法：复制$HADOOP_HOME/etc/hadoop/目录下的log4j.properties文件到MapReduce项目 src文件夹下。 2、当执行MapReduce程序的时候，Eclipse可能会报告堆益处的错误。此时，MapReduce程序执行的out目录已...

安装Hadoop系列 — eclipse plugin插件编译安装配置【图】

[一]、环境参数 eclipse-java-kepler-SR2-linux-gtk-x86_64.tar.gz //现在改为eclipse-jee-kepler-SR2-linux-gtk-x86_64.tar.gzHadoop1.0.3Java 1.8.0Ubuntu 12.04 64bit[二]、安装配置1、复制生成的 hadoop-eclipse-plugin-1.0.3.jar 到 eclipse/plugins 路径下,重启eclipse即可。2、在eclipse菜单依次点击 windows → show view → other… ，选择“Show View”对话框打开，搜索框输入“map”，会找到项“Map/Reduce Locations...

2.1 Hadoop Eclipse Plugin 配置及安装

Hadoop Eclipse 开发工具主要分为1、根据Hadoop版本生成插件 2、安装Hadoop Eclipse插件 3、配置Hadoop目录 4、配置Hadoop连接 5、新一个MapReduce工程 WordCount.javaMapReduce——WordCount问题总结参考：http://blog.sina.com.cn/s/blog_7fcb1aef0100zpux.html正成功输入出后信息:14/05/21 23:06:47 INFO input.FileInputFormat: Total input paths to process : 214/05/21 23:06:47 WARN util.NativeCodeLoader: Unable to ...

ECLIPSE - 技术教程分类

Eclipse 教程 Eclipse 修改字符集 Eclipse 菜单 Eclipse 视图(View) Eclipse 工作空间 Eclipse 生成jar包 Eclipse 关闭项目 Eclipse 编译项目 Eclipse Debug 调试 Eclipse 首选项(Preferences) Eclipse 内容辅助 Eclipse 查找 Eclipse 安装插件 Eclipse 代码模板 Eclipse 快捷键 eclipse 全部

ECLIPSE - 最热教程

Windows下在eclipse中使用和操作hadoop...如何在Eclipse中搭建MyBatis基本开发环...linux 中 eclipse 开发 c/c++ 多线程程...eclipse2019-12设置中文 Hibernate工具在连接MySQL数据库时在Ec...eclipse导入tomcat时Unknown version o...如何在eclipse上添加插件使其实现php的...Eclipse常用快捷键 java – 在Eclipse中访问图像路径 JDBC编程之eclipse准备工作——下载和导...

首页 / ECLIPSE / Windows下Eclipse连接hadoop

Windows下Eclipse连接hadoop

内容导读

内容图文

5.1 出现空指针异常：

内容总结

内容备注

内容手机端

【Windows下Eclipse连接hadoop】教程文章相关的互联网学习教程文章

Windows下Eclipse连接hadoop【代码】【图】

win系统下的eclipse连接和使用linux上的hadoop集群【图】

Eclipse查看hadoop源代码出现Source not found,是因为没有添加.zip【图】

Eclipse Hadoop源码阅读环境

如何通过eclipse查看、阅读hadoop2.4源码【图】

Centos下装eclipse测试Hadoop【代码】【图】

hadoop eclipse工程构建【代码】

使用hadoop eclipse plugin提交Job并添加多个第三方jar

编译eclipse hadoop插件【代码】

win7+eclipse配置Hadoop开发环境注意事项【代码】

Hadoop2.6.2的Eclipse插件的使用【代码】【图】

Hadoop2.4.0 中Eclipse 平台的搭建【图】

使用Eclipse运行Hadoop 2.x MapReduce程序常见问题【图】

安装Hadoop系列 — eclipse plugin插件编译安装配置【图】

2.1 Hadoop Eclipse Plugin 配置及安装

ECLIPSE - 相关标签

HADOOP - 相关标签

ECLIPSE - 技术教程分类

ECLIPSE - 最新教程

ECLIPSE - 最热教程

首页 / ECLIPSE / Windows下Eclipse连接hadoop

Windows下Eclipse连接hadoop

内容导读

内容图文

5.1 出现 空指针异常：

内容总结

内容备注

内容手机端

【Windows下Eclipse连接hadoop】教程文章相关的互联网学习教程文章

ECLIPSE - 相关标签

HADOOP - 相关标签

ECLIPSE - 技术教程分类

ECLIPSE - 最新教程

ECLIPSE - 最热教程

5.1 出现空指针异常：