首页 / HADOOP / hadoop 学习（四）之java操作hdfs

hadoop 学习（四）之java操作hdfs

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了hadoop 学习（四）之java操作hdfs，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1371字，纯文字阅读大概需要2分钟。

内容图文

1、导入hadoop jar包

将hadoop/share/common/目录、hadoop/share/common/lib/目录、hadoop/hdfs/目录、下的jar包加入eclipse。

2、开始编码调用

            static FileSystem  fs=null;
    publicstaticvoid main(String[] args) throws Exception {
        // TODO Auto-generated method stub        init();        
        testUpload();
    }
    
    
    publicstaticvoid init() throws Exception{
        fs=FileSystem.get(new URI("hdfs://192.168.1.7:9000"), new  Configuration(),"hadoop");
        
    }
    
    /**
     * 将本地文件复制到hdfs文件系统里面
     * @throws Exception
     * @throws IOException
     */publicstaticvoid testUpload() throws Exception, IOException{
        OutputStream remote= fs.create(new Path("/uploadjdk"));
        FileInputStream local=new FileInputStream("c://jdk.rar");
        IOUtils.copyBytes(local, remote,4096,true);
    }
    
    /**
     * 从hdfs文件系统里面下载文件 
     * @throws Exception
     * @throws IOException
     */publicvoid testDownload() throws Exception, IOException{
        InputStream in= fs.open(new Path("/eclipse-SDK-4.3.1-linux-gtk-x86_64.tar.gz"));
        OutputStream output=new FileOutputStream("c://jdk2.rar");
        IOUtils.copyBytes(in, output,4096,true);
    }

testUpload 方法是将本地“c://jdk.rar”文件上传到hdfs系统根目录中并命名为uploadjdk.

testDownload 方法是将hdfs系统中的根目录下的“eclipse-SDK-4.3.1-linux-gtk-x86_64.tar.gz”下载到本址c盘，并命名为“jdk2.rar”
值得注意的是：hdfs://192.168.1.7:9000"地址是第二篇文章“ubuntu hadoop 2.7.0 伪分部安装”中 /usr/local/hadoop/etc/hadoop/core-site.xml 文件中配置的地址。如果配置的为

"hdfs://localhost:9000" 需要将其更改为实际机器IP才可以正常访问。

原文：http://www.cnblogs.com/lvlv/p/4496299.html

内容总结

以上是互联网集市为您收集整理的hadoop 学习（四）之java操作hdfs全部内容，希望文章能够帮你解决hadoop 学习（四）之java操作hdfs所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1194132.html

来源：【匿名】

【上一篇】大数据测试之hadoop单机环境搭建(超级详细版)【下一篇】php能用hadoop吗

更多 ►

【hadoop 学习（四）之java操作hdfs】教程文章相关的互联网学习教程文章

hadoop 学习（四）之java操作hdfs【代码】

1、导入hadoop jar包将hadoop/share/common/目录、hadoop/share/common/lib/目录、hadoop/hdfs/目录、下的jar包加入eclipse。2、开始编码调用static FileSystem fs=null;publicstaticvoid main(String[] args) throws Exception {// TODO Auto-generated method stub init(); testUpload();}publicstaticvoid init() throws Exception{fs=FileSystem.get(new URI("hdfs://192.168.1.7:9000"), new Configuration()...

hadoop2.7.2修改配置文件，配置linux java环境变量

1.修改core-site.xml，加上<property> <name>fs.defaultFS</name> <value>hdfs://backup02:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>file:/home/zhongml/hadoop-2.7.2/tmp</value> </property> <property> <name>io.file.buffer.size</name> <value>131702</value> </property>2.修改hdfs-site.xml，加上<property> <name>dfs.n...

Hadoop中RPC协议小例子报错java.lang.reflect.UndeclaredThrowableException解决方法【代码】【图】

最近在学习传智播客吴超老师的Hadoop视频，里面他在讲解RPC通信原理的过程中给了一个RPC的小例子，但是自己编写的过程中遇到一个小错误，整理如下：log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory).log4j:WARN Please initialize the log4j system properly.log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.Exception in thread...

java类型与Hadoop类型之间的转换

java基本类型与Hadoop常见基本类型的对照Long 　　　　LongWritableInteger 　　 IntWritableBoolean 　　BooleanWritableString Text Java类型如何转化为Hadoop基本类型？调用hadoop类型的构造方法，或者调用set()方法。　　new LongWritable(123L); hadoop基本类型如何转化为java类型？　　对于Text，需要调用toString()方法，其他类型调用get()方法。　　以后继续，深入原文：http://www.cnblogs.com/zlslch/p/6438443.ht...

Hadoop上路-03_Hadoop JavaAPI【代码】【图】

一。<SPAN style=‘font-family: "Times New Roman";‘>Eclipse安装 1.下载解压下载：http://www.eclipse.org/downloads/ 解压：<SPAN style=‘color: rgb(153, 51, 0); font-family: "courier new", courier;‘>SHELL$ sudo tar -zxvf eclipse.tar.gz 2.快捷方式右键<SPAN style=‘font-family: "Times New Roman";‘>Ubuntu桌面，创建启动器 3.创建一个<SPAN style=‘font-family: "Times New Roman";‘>JavaProject...

Hadoop序列化与Java序列化

序列化就是把内存中的对象的状态信息转换成字节序列，以便于存储（持久化）和网络传输反序列化就是就将收到的字节序列或者是硬盘的持久化数据，转换成内存中的对象。1.JDK的序列化　　只要实现了serializable接口就能实现序列化与反序列化，一定要加上序列化版本ID serialVersionUID，这个是用来识别序列化的之前的类到底是哪一个。比如希望类的不同版本对序列化兼容，需要确保类的不同版本具有相同的serialVersionUID；　　Java序...

Hadoop教程(四)HDFS文件系统JavaAPI接口【图】

Hadoop教程(四)HDFS文件系统JavaAPI接口 HDFS是存取数据的分布式文件系统，HDFS文件操作常有两种方式，一种是命令行方式，即Hadoop提供了一套与Linux文件命令类似的命令行工具。另一种是JavaAPI，即利用Hadoop的Java库，采用编程的方式操作HDFS的文件。 1 软件下载及安装 1.1 相关下载1、JDK下载：Java是运行在JVM虚拟机 (Java Virtual Machine)之上，因此它的运行需要JDK环境的支持，建议下载Oracle官方发布的JDK，下载地址：http...

spark集群进入 bin 下面目录./spark-shell 出现Unable to load native-hadoop library for your platform... using builtin-java classes where applicable【代码】

spark集群启动的时候可以正常，进入 ./spark-shell 就会出现如下错误配置文件：spark-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_51export SCALA_HOME=/home/hadoop/scala-2.11.6export SPARK_MASTER_IP=master24export SPARK_MASTER_PORT=17077export SPARK_MASTER_WEBUI_PORT=18080export SPARK_WORKER_CORES=1export SPARK_WORKER_MEMORY=30gexport SPARK_WORKER_WEBUI_PORT=18081export SPARK_WORKER_INSTANCES=1INFO SparkEn...

Java笔记---Hadoop 2.7.1下WordCount程序详解【代码】【图】

一、前言在之前我们已经在 CenOS6.5 下搭建好了 Hadoop2.x 的开发环境。既然环境已经搭建好了，那么现在我们就应该来干点正事嘛！比如来一个Hadoop世界的HelloWorld，也就是WordCount程序(一个简单的单词计数程序)二、WordCount 官方案例的运行2.1 程序简介WordCount程序是hadoop自带的案例，我们可以在 hadoop 解压目录下找到包含这个程序的 jar 文件(hadoop-mapreduce-examples-2.7.1.jar)，该文件所在路径为 hadoop/share/hadoo...

Apache Hadoop 运行分布式程序方法总结（Streaming方式与原生JAVA接口）【代码】【图】

1. Hadoop Streaming方式运行程序Hadoop Streaming可以运行除JAVA语言以外，其它的语言编写的程序。其启动脚本示例如下： 1 #!/bin/sh 2 3# 参数合法性判断4 5if [ $# != 7 ]; then 6echo"./bin/avp_platform_startup.sh [USER_NAME] [INPUT_PAT] [OUTPUT_PAT] [MAP_TASKS] [REDUCE_TASKS] [CLASS_ID] [CODE_TYPE]" 7 exit8fi 910# GLOBAL VARS 11 USER_NAME=$112 INPUT_PAT=$213 OUTPUT_PAT=$314 MAP_TASKS=$415 REDUCE_TASK...

错误Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream排查思路

spark1（默认CDH自带版本）不存在这个问题，主要是升级了spark2（CDHparcel升级）版本安装后需要依赖到spark1的旧配置去读取hadoop集群的依赖包。1./etc/spark2/conf目录需要指向/hadoop1/cloudera-manager/parcel-repo/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/etc/spark2/conf.dist （命令ln -s /hadoop1/cloudera-manager/parcel-repo/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/etc/spark2/conf.dist /etc/spark2/conf...

Hadoop-Zookeeper环境搭建、Zookeeper的shell操作、Zookeeper的JavaAPI【代码】

环境搭建1、下载Zookeeper安装包 2、解压 3、到Zookeeper解压后的文件夹中，将conf中zoo_sample.cfg复制并重命名为zoo.cfg 4、将zoo.cfg中的autopurge.snapRetainCount=3 autopurge.purgeInterval=1取消注释以及设置机器的消息传输和选举端口 server.1=node01:2888:3888 server.2=node02:2888:3888 server.3=node03:2888:3888 5、在Zookeeper文件夹中新建zkdatas文件夹，在其中再新建myid 向myid中添加机器id echo 1 > myid 6、启...

hive执行query语句时提示错误：org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.io.IOException:

hive> select product_id, track_time from trackinfo limit 5; Total MapReduce jobs = 1 Launching Job 1 out of 1 Number of reduce tasks is set to 0 since there‘s no reduce operator org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.io.IOException: The number of tasks for this job 156028 exceeds the configured limit 5000at org.apache.hadoop.mapred.JobTracker.submitJo...

hadoop安装以及Java API操作hdfs【图】

因为工作需求，需要我这边实现一个大文件上传到HDFS的功能，因为本机无法连接公司内网的集群，无奈只好自己动手搭建一个单节点的Hadoop来满足工作的需求。下面简单介绍下安装过程中遇到的坑我的机器是阿里云的最低配安装文件：hadoop-2.6.0.tar.gz安装过程也不赘述，请参考：http://www.powerxing.com/install-hadoop-in-centos/按部就班的安装完成之后，执行以下命令：cd /usr/local/hadoop/sbinsh start-all.shjps一个都不能少我...

HADOOP nutch java mysql

下载Hadoop安装包wget http://apache.fayea.com/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz java安装wget -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u131-b11/d54c1d3a095b4ff2b6607d096fa80163/jdk-8u131-linux-i586.rpm wget -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u131-b...

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook 使用 Oracle Load For Hadoop（OLH）实...Hadoop基础知识 windows部署hadoop-2.7.0 你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / hadoop 学习（四）之java操作hdfs

hadoop 学习（四）之java操作hdfs

内容导读

内容图文

内容总结

内容备注

内容手机端

【hadoop 学习（四）之java操作hdfs】教程文章相关的互联网学习教程文章

hadoop 学习（四）之java操作hdfs【代码】

hadoop2.7.2修改配置文件，配置linux java环境变量

Hadoop中RPC协议小例子报错java.lang.reflect.UndeclaredThrowableException解决方法【代码】【图】

java类型与Hadoop类型之间的转换

Hadoop上路-03_Hadoop JavaAPI【代码】【图】

Hadoop序列化与Java序列化

Hadoop教程(四)HDFS文件系统JavaAPI接口【图】

spark集群进入 bin 下面目录./spark-shell 出现Unable to load native-hadoop library for your platform... using builtin-java classes where applicable【代码】

Java笔记---Hadoop 2.7.1下WordCount程序详解【代码】【图】

Apache Hadoop 运行分布式程序方法总结（Streaming方式与原生JAVA接口）【代码】【图】

错误Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream排查思路

Hadoop-Zookeeper环境搭建、Zookeeper的shell操作、Zookeeper的JavaAPI【代码】

hive执行query语句时提示错误：org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.io.IOException:

hadoop安装以及Java API操作hdfs【图】

HADOOP nutch java mysql

HADOOP - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程