首页 / HADOOP / hadoop异常: java.io.EOFException: Unexpected end of input stream

hadoop异常: java.io.EOFException: Unexpected end of input stream

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了hadoop异常: java.io.EOFException: Unexpected end of input stream，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3231字，纯文字阅读大概需要5分钟。

内容图文

hadoop异常: java.io.EOFException: Unexpected end of input stream

执行hadoop任务时报错：

2019-06-05 03:23:36,173 INFO [main] org.apache.hadoop.mapred.MapTask: Processing split: Paths:/flume/nginx/app1/2019-06-05/00/app1@flume23_10003_4.1559665890953.gz:0+0,/flume/nginx/app2/2019-06-05/00/app2@flume174_10003_9.1559665804394.gz:0+307548
2019-06-05 03:23:36,257 WARN [main] org.apache.hadoop.security.UserGroupInformation: PriviledgedActionException as:kwang (auth:SIMPLE) cause:java.io.EOFException: Unexpected end of input stream
2019-06-05 03:23:36,258 WARN [main] org.apache.hadoop.mapred.YarnChild: Exception running child : java.io.EOFException: Unexpected end of input stream 
    at org.apache.hadoop.io.compress.DecompressorStream.decompress(DecompressorStream.java:165)
    at org.apache.hadoop.io.compress.DecompressorStream.read(DecompressorStream.java:105)
    at java.io.InputStream.read(InputStream.java:101)
    at org.apache.hadoop.util.LineReader.fillBuffer(LineReader.java:180)
    at org.apache.hadoop.util.LineReader.readDefaultLine(LineReader.java:216)
    at org.apache.hadoop.util.LineReader.readLine(LineReader.java:174)
    at org.apache.hadoop.mapreduce.lib.input.LineRecordReader.skipUtfByteOrderMark(LineRecordReader.java:144)
    at org.apache.hadoop.mapreduce.lib.input.LineRecordReader.nextKeyValue(LineRecordReader.java:184)
    at org.apache.hadoop.mapreduce.lib.input.CombineFileRecordReaderWrapper.nextKeyValue(CombineFileRecordReaderWrapper.java:90)
    at org.apache.hadoop.mapreduce.lib.input.CombineFileRecordReader.nextKeyValue(CombineFileRecordReader.java:69)
    at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyValue(MapTask.java:562)
    at org.apache.hadoop.mapreduce.task.MapContextImpl.nextKeyValue(MapContextImpl.java:80)
    at org.apache.hadoop.mapreduce.lib.map.WrappedMapper$Context.nextKeyValue(WrappedMapper.java:91)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:793)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341)
    at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:164)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1924)
    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:158)

产生原因：

以上报错原因基本都是由于HDFS上的文件异常结束导致的，通过查看log，发现/flume/nginx/app1/2019-06-05/00/app1@flume23_10003_4.1559665890953.gz:0+0 这个文件的大小为0字节。要理解空文件的产生，先需要清楚集群flume采集日志的逻辑，集群中采用flume采集到日志写入到HDFS，采集过程中flume会先新建一个*.gz.tmp文件，flume持续的向*.gz.tmp文件中追加数据，在写周期到达时将*.gz.tmp重命名为*.gz，而空文件产生的原因是flume新建了*.gz.tmp文件后，没有新数据产生，重命名后文件大小为空。

解决办法：
将空gz文件删除后重新运行任务即可。

还有另一种原因，当设置了如下参数对文件进行分割切片时，导致部分文件为空文件，从而解析过程中出现异常。当然，这种原因取决于文件的原始格式是否可压缩，像gz、snappy、lzo文件是不可分割的，设置如下参数就不会出现以上报错，像orc文件是可分割的，设置如下参数可能会出现以上异常。

-Dmapreduce.input.fileinputformat.split.minsize=134217728 -Dmapreduce.input.fileinputformat.split.maxsize=512000000

【参考资料】

[1]. 菜菜光, hadoop Unexpected end of input stream 错误.

内容总结

以上是互联网集市为您收集整理的hadoop异常: java.io.EOFException: Unexpected end of input stream全部内容，希望文章能够帮你解决hadoop异常: java.io.EOFException: Unexpected end of input stream所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/812411.html

来源：【匿名】

【上一篇】java – 所有地图任务的Hadoop缓存文件【下一篇】php能用hadoop吗

更多 ►

【hadoop异常: java.io.EOFException: Unexpected end of input stream】教程文章相关的互联网学习教程文章

Secondarynamenode无法正常备份:ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint【代码】

原先使用hadoop默认设置（hadoop1.2.1），secondarynamenode会正常进行备份，定时从namenode拷贝image文件到SNN。但是具体SNN备份的时间周期和log文件的大小无法定制，后来楼主就修改了SNN的设置，将fs.checkpoint.period修改为3600s,fs.checkpoint.size修改为64兆。在core-site.xml配置文件中添加这两个参数之后，却发现SNN总是无法备份。后来google查找发现还是配置文件没有配置完整造成的，修改配置文件core-site.xml 和hdfs-si...

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=Mypc, access=WRITE, inode="/":fan:supergroup:drwxr-xr-x【代码】

在window上编程提示没有写Hadoop的权限 Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=Mypc, access=WRITE, inode="/":fan:supergroup:drwxr-xr-x 曾经踩过的坑：保存结果到hdfs上没有写的权限* 通过修改权限将文件写入到指定的目录下* * $HADOOP_HOME/bin/hdfs dfs -mkdir /output* $HADOOP_HOME/bin/hdfs dfs -chmod 777...

Exception from container-launch: org.apache.hadoop.util.Shell$ExitCodeException【图】

使用MapReduce编写的中文分词程序出现了 Exception from container-launch: org.apache.hadoop.util.Shell$ExitCodeException: 这样的问题如图：上网查了好多资料，才明白这是hadoop本身的问题，具体参考：https://issues.apache.org/jira/browse/YARN-1298https://issues.apache.org/jira/browse/MAPREDUCE-5655解决办法是重新编译hadoop具体参考：http://zy19982004.iteye.com/blog/2031172版权声明：本文为博主原创文章，未经博...

错误Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream排查思路

spark1（默认CDH自带版本）不存在这个问题，主要是升级了spark2（CDHparcel升级）版本安装后需要依赖到spark1的旧配置去读取hadoop集群的依赖包。1./etc/spark2/conf目录需要指向/hadoop1/cloudera-manager/parcel-repo/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/etc/spark2/conf.dist （命令ln -s /hadoop1/cloudera-manager/parcel-repo/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/etc/spark2/conf.dist /etc/spark2/conf...

开启Hadoop/Yarn的日志监控功能,配置Spark历史服务，解决web端查看日志时的Java.lang.Exception:Unknown container问题【代码】【图】

解放方法下来查询官方文档后，才了解到yarn的日志监控功能默认是处于关闭状态的，需要我们进行开启，开启步骤如下： Ps:下面配置的文件的位置在hadoop根目录 etc/haddop文件夹下，比较老版本的Hadoop是在hadoop根目录下的conf文件夹中本文hadoop配置环境目录： /usr/local/src/hadoop-2.6.5/etc/hadoop 一、在yarn-site.xml文件中添加日志监控支持 <property><name>yarn.log-aggregation-enable</name><value>true</value> </prop...

解决Exception: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

* Licensed to the Apache Software Foundation (ASF) under one* or more contributor license agreements. See the NOTICE file* distributed with this work for additional information* regarding copyright ownership. The ASF licenses this file* to you under the Apache License, Version 2.0 (the* "License"); you may not use this file except in compliance* with the License. You may obtain a copy of the Li...

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=Mypc, access=WRITE, inode="/":fan:supergroup:drwxr-xr-x【代码】

Hadoop异常：namenode.NameNode: Encountered exception during format【代码】

00:53:47,977 WARN namenode.NameNode: Encountered exception during format: java.io.IOException: Cannot remove current directory: /home/hadoop/tmp/dfs/name/currentat org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.clearDirectory(Storage.java:433)at org.apache.hadoop.hdfs.server.namenode.NNStorage.format(NNStorage.java:579)at org.apache.hadoop.hdfs.server.namenode.NNStorage.format(NNSt...

Call From DESKTOP-SP7EDPV/10.10.7.83 to hadoop102:8020 failed on connection exception: java.net.Conn【图】

Exception in thread "main" java.net.ConnectException: Call From DESKTOP-SP7EDPV/10.10.7.83 to hadoop102:8020 failed on connection exception: java.net.ConnectException: Connection refused: no further information; For more details see: http://wiki.apache.org/hadoop/ConnectionRefusedat sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)at sun.reflect.NativeConstructorAccessorImpl.n...

使用eclipse连接hadoop 错误：Call From allen/192.168.190.1 to node2:8020 failed on socket timeout exception

hadoop集群已经成功启动，但是在使用eclipse连接的时候还是报了这个错误 Exception while invoking getFileInfo of class ClientNamenodeProtocolTranslatorPB over node2/192.168.190.6:8020 after 5 fail over attempts.at org.apache.hadoop.ipc.Client.call(Client.java:1401) at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:232) 原因是我在windows系统的hosts文件中曾修改过ip的映射...

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission d【代码】【图】

保存文件时权限被拒绝曾经踩过的坑：保存结果到hdfs上没有写的权限通过修改权限将文件写入到指定的目录下 * * * $HADOOP_HOME/bin/hdfs dfs -chmod 777 /user * * * Exception in thread "main" org.apache.hadoop.security.AccessControlException: * Permission denied: user=Mypc, access=WRITE, * inode="/":fan:supergroup:drwxr-xr-xpackage cn.spark.study.sql;import org.apache.spark.SparkConf; im...

hadoop failed on socket timeout exception: java.net.NoRouteToHostException: No route to host【图】

hadoop copyFromLocal 的时候报错，hadoop failed on socket timeout exception: java.net.NoRouteToHostException: No route to host 我的 core-site.xml 的配置如下：将IP地址改为 localhost 后问题解决。配置还不太熟悉，后续补充。

INPUT - 相关标签

input函数 input事件

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook Hadoop基础知识 windows部署hadoop-2.7.0 使用 Oracle Load For Hadoop（OLH）实...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / hadoop异常: java.io.EOFException: Unexpected end of input stream

hadoop异常: java.io.EOFException: Unexpected end of input stream

内容导读

内容图文

内容总结

内容备注

内容手机端

【hadoop异常: java.io.EOFException: Unexpected end of input stream】教程文章相关的互联网学习教程文章

Secondarynamenode无法正常备份:ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint【代码】

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=Mypc, access=WRITE, inode="/":fan:supergroup:drwxr-xr-x【代码】

Exception from container-launch: org.apache.hadoop.util.Shell$ExitCodeException【图】

错误Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream排查思路

开启Hadoop/Yarn的日志监控功能,配置Spark历史服务，解决web端查看日志时的Java.lang.Exception:Unknown container问题【代码】【图】

解决Exception: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=Mypc, access=WRITE, inode="/":fan:supergroup:drwxr-xr-x【代码】

Hadoop异常：namenode.NameNode: Encountered exception during format【代码】

Call From DESKTOP-SP7EDPV/10.10.7.83 to hadoop102:8020 failed on connection exception: java.net.Conn【图】

使用eclipse连接hadoop 错误：Call From allen/192.168.190.1 to node2:8020 failed on socket timeout exception

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission d【代码】【图】

hadoop failed on socket timeout exception: java.net.NoRouteToHostException: No route to host【图】

HADOOP - 相关标签

INPUT - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程