首页 / HADOOP / Hadoop序列化与Java序列化

Hadoop序列化与Java序列化

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop序列化与Java序列化，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1255字，纯文字阅读大概需要2分钟。

内容图文

序列化就是把内存中的对象的状态信息转换成字节序列，以便于存储（持久化）和网络传输

反序列化就是就将收到的字节序列或者是硬盘的持久化数据，转换成内存中的对象。

1.JDK的序列化

　　只要实现了serializable接口就能实现序列化与反序列化，一定要加上序列化版本ID serialVersionUID，这个是用来识别序列化的之前的类到底是哪一个。比如希望类的不同版本对序列化兼容，需要确保类的不同版本具有相同的serialVersionUID；

　　Java序列化算法需要考虑：

　　将对象实例相关的类元数据输出。

　　递归地输出类的超类描述直到不再有超类。

　　类元数据完了之后，开始从最顶层的超类开始输出对象实例的实际数据值

　　从上至下递归输出实例的数据

　　所以java序列化很强大，序列化得到的信息很详细，但是序列化后很占内存。

2.Hadoop序列化

　　相对于JDK比较简洁，在急群众信息的传递主要就是靠这些序列化的字节楼来传递的，所以更快速度，容量更小。

　　hadoop序列化特点：

　　1.紧凑：带宽是集群中信息传递的最宝贵的资源所以我们必须想法设法缩小传递信息的大小　。

　　 java序列化不够灵活，为了更好的控制序列化的整个流程所以使用Writable　

　　　java序列化会保存类的所有信息依赖等，hadoop序列化不需要

　　2.对象可重用：JDK的反序列化会不断地创建对象，这肯定会造成一定的系统开销，但是在hadoop的反序列化中，能重复的利用一个对象的readField方法来重新产生不同的对象。

　　 java序列化每次序列化都要重新创建对象，内存消耗大。Writable可以重用。

　　3.可拓展性

　　 hadoop自己写序列化很容易，可以利用实现hadoop的Writable接口实现了直接比较字符流以确定两个Writable对象的大小。

　　　而java不是，java的序列化机制在每个类的对象第一次出现的时候保存了每个类的信息, 比如类名, 第二次出现的类对象会有一个类的reference, 导致空间的浪费

　　可以使用开源的序列化框架protocol Buffers，Avro等框架

　　 hadoop原生的序列化类需要实现一个叫Writeable的接口，类似于serializable接口

　　实现Writable接口必须实现两个方法：write(DataOutputStream out);readField(DataInputStream in)方法。

　　YARN的序列化就是用Google开发的序列化框架protocol Buffers，proto目前支持支持三种语言C++，java，Python所以RPC这一层我们就可以利用其他语言来做文章

　　Apache的Thrift和Google的Protocol Buffer也是比较流行的序列化框架，但是在Hadoop里使用是有限的，只用于RPC和数据交互

原文：http://www.cnblogs.com/kxdblog/p/4799282.html

内容总结

以上是互联网集市为您收集整理的Hadoop序列化与Java序列化全部内容，希望文章能够帮你解决Hadoop序列化与Java序列化所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1166468.html

来源：【匿名】

【上一篇】hadoop实战随笔_170814 【下一篇】php能用hadoop吗

更多 ►

【Hadoop序列化与Java序列化】教程文章相关的互联网学习教程文章

Hadoop序列化与Java序列化

序列化就是把内存中的对象的状态信息转换成字节序列，以便于存储（持久化）和网络传输反序列化就是就将收到的字节序列或者是硬盘的持久化数据，转换成内存中的对象。1.JDK的序列化　　只要实现了serializable接口就能实现序列化与反序列化，一定要加上序列化版本ID serialVersionUID，这个是用来识别序列化的之前的类到底是哪一个。比如希望类的不同版本对序列化兼容，需要确保类的不同版本具有相同的serialVersionUID；　　Java序...

Hadoop序列化【代码】【图】

1.序列化所谓的序列化，就是将结构化对象转化为字节流，以便在网络上传输或是写道磁盘进行永久存储。反序列化，就是将字节流转化为结构化对象。在Java中也存在序列化，刚学Java的时候，接触的第一个项目就是QQ聊天系统，也就是网络编程，其中，用到的就是字符流传输数据，通过对象序列化，然后转化为字符流或字节流，通过socket传递数据。同理，序列化在分布式数据处理的两大领域经常出现：进程间通信和永久存储。在Hado...

Hadoop序列化概述【图】

序列化概述: 原文：https://www.cnblogs.com/comw/p/13381286.html

Hadoop序列化与Writable接口(一)【图】

序列化序列化（serialization）是指将结构化的对象转化为字节流，以便在网络上传输或者写入到硬盘进行永久存储；相对的反序列化（deserialization）是指将字节流转回到结构化对象的过程。在分布式系统中进程将对象序列化为字节流，通过网络传输到另一进序列化序列化（serialization）是指将结构化的对象转化为字节流，以便在网络上传输或者写入到硬盘进行永久存储；相对的反序列化（deserialization）是指将字节流转回到结构化...

Hadoop序列化与Writable接口(二)

上一篇文章Hadoop序列化与Writable接口（一）介绍了Hadoop序列化，Hadoop Writable接口以及如何定制自己的Writable类，在本文中我们继续Hadoop Writable类的介绍，这一次我们关注的是Writable实例序列化之后占用的字节长度，以及Writable实例序列化之后的字上一篇文章Hadoop序列化与Writable接口（一）介绍了Hadoop序列化，Hadoop Writable接口以及如何定制自己的Writable类，在本文中我们继续Hadoop Writable类的介绍，这一次我们...

3.1.2 HADOOP框架（MapReduce编程框架，序列化Writeable接口，Maptask并行度，ReduceTadk并行度，shuffle机制，排序，join,自定义读取、输出）【图】

3.1.2 HADOOP框架文章目录 3.1.2 HADOOP框架六、MapReduce编程框架6.1 MapReduce思想6.2 官?WordCount案例源码解析6.3 MapReduce编程规范及示例编写6.3.1 Mapper类6.3.2 Reducer类6.3.3 Driver阶段6.3.4 WordCount代码实现6.3.4.1 需求6.3.4.2 具体步骤6.4 序列化Writable接口6.4.1 实现Writable序列化步骤如下6.4.2 Writable接口案例 6.5 MapReduce原理分析6.5.1 MapTask运行机制详解6.5.2 MapTask的并行度6.5.2.1 切片机制源码阅...

hadoop序列化机制与java序列化机制对比

原文链接：http://www.cnblogs.com/riasky/p/3429170.html1、采用的方法： java序列化机制采用的ObjectOutputStream 对象上调用writeObject() 方法； Hadoop 序列化机制调用对象的write() 方法，带一个DataOutput 类型的参数； 2、反序列化过程：两者都是从流中读取数据，java的反序列化过程会不断的创建新的对象；Hadoop反序列化机制不断的复用对象（在Block 的某个对象上反复调用readFields()，可以在同一个对象上得...

为什么hadoop中用到的序列化不是java的serilaziable接口去序列化而是使用Writable序列化框架【代码】【图】

继上一个模块之后，此次分析的内容是来到了Hadoop IO相关的模块了，IO系统的模块可谓是一个比较大的模块，在Hadoop Common中的io,主要包括2个大的子模块构成，1个是以Writable接口为主的序列化模块，还有1个是解压缩模块，所以打算分成2个模块做分析，今天来说说序列化，反序列化的分析学习，当然不只是简单的wrtite,read等的简单调度。在分析之前，看下IO包的类包含图：在Hadoop中，你可以用java自带的序列化方式的实现，但是不推...

序列化 - 相关标签

序列化和反序列化

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook 使用 Oracle Load For Hadoop（OLH）实...Hadoop基础知识 windows部署hadoop-2.7.0 你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop序列化与Java序列化

Hadoop序列化与Java序列化

内容导读

内容图文

内容总结

内容备注

内容手机端

【Hadoop序列化与Java序列化】教程文章相关的互联网学习教程文章

Hadoop序列化与Java序列化

Hadoop序列化【代码】【图】

Hadoop序列化概述【图】

Hadoop序列化与Writable接口(一)【图】

Hadoop序列化与Writable接口(二)

3.1.2 HADOOP框架（MapReduce编程框架，序列化Writeable接口，Maptask并行度，ReduceTadk并行度，shuffle机制，排序，join,自定义读取、输出）【图】

hadoop序列化机制与java序列化机制对比

为什么hadoop中用到的序列化不是java的serilaziable接口去序列化而是使用Writable序列化框架【代码】【图】

HADOOP - 相关标签

序列化 - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程