首页 / HADOOP / Hadoop基础【1.1】 Writeable

Hadoop基础【1.1】 Writeable

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Hadoop基础【1.1】 Writeable，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3516字，纯文字阅读大概需要6分钟。

内容图文

MapReduce由于最耗时的是落盘与通信，所以采用了自定的Writeable的序列化反序列化（在结构化对象与二进制流之间的转换以便于节点通信：压缩过，使得节点之间带宽占用较少，可以快速读写），在Mapper Reducer里头常用的比如LongWriteable Text等等。我们根据不同的需求，对其进行一个复杂的定制，主要通过继承Writeable接口来实现。

源码如下

首先看下Writeable接口

            package
             org.apache.hadoop.io;  

            public
            interface
             Writable {  
    
            void write(java.io.DataOutput var1) throws java.io.IOException;  
  
    void readFields(java.io.DataInput var1) throws java.io.IOException;  
}

就俩接口，write和readFields，write用来序列化，readFileds用来反序列化

看下LongWriteable怎么实现的

             1
            import
             java.io.DataInput;

             2
            import
             java.io.DataOutput;

             3
            import
             java.io.IOException;

             4
             5
            public
            class LongWritable implements WritableComparable<LongWritable> {
 6privatelong value;
 7 8public LongWritable() {
 9    }
1011public LongWritable(long value) {
12this.set(value);
13    }
1415publicvoid set(long value) {
16this.value = value;
17    }
1819publiclong get() {
20returnthis.value;
21    }
2223publicvoid readFields(DataInput in) throws IOException {
24this.value = in.readLong();
25    }
2627publicvoid write(DataOutput out) throws IOException {
28         out.writeLong(this.value);
29    }
3031publicboolean equals(Object o) {
32if (!(o instanceof LongWritable)) {
33returnfalse;
34         } else {
35             LongWritable other = (LongWritable)o;
36returnthis.value == other.value;
37        }
38    }
3940publicint hashCode() {
41return (int)this.value;
42    }
4344publicint compareTo(LongWritable o) {
45long thisValue = this.value;
46long thatValue = o.value;
47return thisValue < thatValue ? -1 : (thisValue == thatValue ? 0 : 1);
48    }
4950public String toString() {
51return Long.toString(this.value);
52    }
5354static {
55         WritableComparator.define(LongWritable.class, new LongWritable.Comparator());
56    }
5758publicstaticclass DecreasingComparator extends LongWritable.Comparator {
59public DecreasingComparator() {
60        }
6162publicint compare(WritableComparable a, WritableComparable b) {
63returnsuper.compare(b, a);
64        }
6566publicint compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) {
67returnsuper.compare(b2, s2, l2, b1, s1, l1);
68        }
69    }
7071publicstaticclass Comparator extends WritableComparator {
72public Comparator() {
73super(LongWritable.class);
74        }
7576publicint compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) {
77long thisValue = readLong(b1, s1);
78long thatValue = readLong(b2, s2);
79return thisValue < thatValue ? -1 : (thisValue == thatValue ? 0 : 1);
80        }
81    }
82 }

WriteableComparable如下

WritableComparable是Hadoop的排序方式之一，而排序是MapReduce框架中最重要的操作之一，它就是用来给数据排序的（按照Key排好），常发生在MapTask与ReduceTask的传输过程中（就是数据从map方法写到reduce方法之间，shuffle呗？）

            public
            interface WritableComparable<T> extends Writable, Comparable<T> {
}

21为止getter setter加简单的构造函数，50-52为toString，23-29实现Writable里的两个方法（DataOutput.writeLong&DataInput.readLong），44-48为Comparable的compareTo，然后Object为LongWriteable且value同则equals返回true，hashcode方法返回value

对于简单的仅在Map的输出和Reduce的输入这儿用的的地方来说，一般compareTo，toString，write，readFields写完就ok了

然后再往下看？Comparator？啥玩意？

WritableComparator（54-81行）

WritableComparator类大致类似于一个注册表，里面记录了所有Comparator类的集合。Comparators成员用一张Hash表记录Key=Class，value=WritableComprator的注册信息。（PS：工厂模式）

它继承了RawComparator，RawComparator是用来实现直接比较数据流中的记录，无需先把数据流序列化为对象，这样便避免了新建对象的额外开销。

因此54-56为static块把LongWriteable“注册了”，71-80就是LongWriteable在static块里头要注册的Comparator（我大1，我小-1，我相等就0）（ API这么写的 This base implemenation uses the natural ordering. To define alternate orderings）看起来不大清楚是干嘛的。。。

尝试了下在wordcount里头，把Reduce的output变成自己定义的，没写Comparator的StupidIntWritable，但是也能正常输出。。。我这就迷惑了。。。再想想把。。。

原文：https://www.cnblogs.com/tillnight1996/p/12317072.html

内容总结

以上是互联网集市为您收集整理的Hadoop基础【1.1】 Writeable全部内容，希望文章能够帮你解决Hadoop基础【1.1】 Writeable所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1327632.html

来源：【匿名】

【下一篇】php能用hadoop吗

更多 ►

【Hadoop基础【1.1】 Writeable】教程文章相关的互联网学习教程文章

Hadoop基础【1.1】 Writeable【代码】

Hadoop基础入门【图】

一、hadoop是什么？　　(1)Hadoop是一个开源的框架，可编写和运行分布式应用处理大规模数据，是专为离线和大规模数据分析而设计的，并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS（文件系统，数据存储技术相关）+ Mapreduce（数据处理），Hadoop的数据来源可以是任何形式，在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能，具有更灵活的处理能力，不管任何数据形式最终会转化为key/value，key/va...

20190228 搭建Hadoop基础环境【图】

下载VMware 12 版本以上下载CentOS 7以上版本安装虚拟机，安装系统时，注意设置root 账号和密码虚拟机配置网络，命令ip addr 查看IP 地址，（配置网络网上有很多办法，百度即可）保证虚拟机和主机可以相互ping IP 后，端口22可访问安装WinSCP，进行一些工具包的上传下载，在网络不能拉取的情况下如图： linux 系统中要其中共享文件夹的部分比较麻烦，试了很多次虽然虚拟机配置了，但在客户机不能访问/mnt/fgfs文件安装也没能使用，...

hadoop基础

http://blog.csdn.net/xuqianghit/article/details/6580253 使用java api操作Hadoop文件http://www.tuicool.com/articles/VJRrArz java api hdfshttp://www.cnblogs.com/xuqiang/archive/2011/06/03/2042526.html 使用java api操作Hadoop文件 (附代码)http://blog.csdn.net/xuqianghit/article/details/6580254 通过shell命令来控制hdfshttp://www.tuicool.com/articles/QRZBji 通过shell命令来控制hdfs原文：http://www.cnblogs....

【原创】大数据基础之Hadoop（3）hdfs diskbalancer【代码】

hdfs单个节点内多个磁盘不均衡时（比如新加磁盘），需要手工进行diskbalancer操作，命令如下# hdfs diskbalancer -help plan usage: hdfs diskbalancer -plan <hostname> [options] Creates a plan that describes how much data should be moved between disks.--bandwidth <arg> Maximum disk bandwidth (MB/s) in integerto be consumed by diskBalancer. e.g. 10MB/s.--maxerror <arg> Describes how...

Hadoop基础-Combiner使用场景介绍

Hadoop基础【图】

1.hadoop是一份分布式的基础架构（分服务器部署）2.优点：可扩展3.NameNode：名称节点，管理文件系统DataNode：数据节点，文件系统的工作者4.HDFS：不适合低延迟的数据访问，不适合大量的小文件。默认128MB5.主要的是ResourceManger和NodeManager 原文：https://www.cnblogs.com/sunxiaoyan/p/9216664.html

[转载] 《Hadoop基础教程》之初识Hadoop【图】

转载自http://blessht.iteye.com/blog/2095675Hadoop一直是我想学习的技术，正巧最近项目组要做电子商城，我就开始研究Hadoop，虽然最后鉴定Hadoop不适用我们的项目，但是我会继续研究下去，技多不压身。《Hadoop基础教程》是我读的第一本Hadoop书籍，当然在线只能试读第一章，不过对Hadoop历史、核心技术和应用场景有了初步了解。 Hadoop历史雏形开始于2002年的Apache的Nutch，Nutch是一个开源Java 实现的搜索引...

Hadoop基础-HDFS的写入过程

Linux下hadoop和spark的基础环境配置准备

我使用了4台虚拟机centos7来搭建环境，2个主结点（一般是一个，但为了体验zookeeper，万一其中一个master挂掉呢，另外一个会自动启动接管），2个从结点注意：下面的配置主要以主节点为例进行说明第一步：同步四台机器的时钟　　sudo yum install ntpdate，确保已安装ntpdate，分别运行sudo ntpdate cn.pool.ntp.org第二步：设置主机名修改/etc/sysconfig/network文件，NETWORKING = yesHOSTNAME = master(主节点)其实在centos7下面...

《Hadoop基础教程》之初识Hadoop【图】

Hadoop历史雏形开始于2002年的Apache的Nutch，Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。随后在2003年Google发表了一篇技术学术论文谷歌文件系统（GFS）。GFS也就是google File System，google公司为了存储海量搜索数据而设计的专用文件系统。 2004年Nutch创始人Doug Cutting基于Google的GFS论文实现了分布式文件存储系统名为NDFS。 ...

Hadoop基础-05-HDFS项目(词频统计)【代码】

目录HDFS项目实战需求分析代码框架编写上下文处理类实现功能实现HDFS项目实战需求分析使用HDFS Java API 才完成HDFS文件系统上的额文件的词频统计例子/test/1.txt ==> ‘ hello world‘/test/2.txt ==> ‘ hello world world‘得出 hello 两个, world 三个代码框架编写1:读取HDFS上的文件2:词频统计3:将处理的结果混存起来 Map4:将结果输出到HDFS上下文package com.bigdata.hadoop.hdfs;import java.util.HashMap; import java.u...

Hadoop基础（七）：HDFS的Shell操作（开发重点）【代码】【图】

1．基本语法bin/hadoop fs 具体命令 OR bin/hdfs dfs 具体命令dfs是fs的实现类。 2．命令大全 [atguigu@hadoop102 hadoop-2.7.2]$ bin/hadoop fs[-appendToFile <localsrc> ... <dst>][-cat [-ignoreCrc] <src> ...][-checksum <src> ...][-chgrp [-R] GROUP PATH...][-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...][-chown [-R] [OWNER][:[GROUP]] PATH...][-copyFromLocal [-f] [-p] <localsrc> ... <dst>][-copyToLocal...

大数据学习初体验：Linux学习+Shell基础编程+hadoop集群部署【代码】【图】

距离上次博客时间已经9天，简单记录下这几天的学习过程2020-02-15 10:38:47一、Linux学习关于Linux命令，我在之前就已经学过一部分了，所以这段时间的linux学习更多的是去学习Linux系统的安装以及相关配置多一些，命令会一些比较常用的就够了，下面记录下安装配置Linux系统时的注意事项。这里配置的虚拟机的内存为4g使用的 CentOS-6.5-x86_64-minimal.iso 映射文件在进入linux系统中时，需要将虚拟机的主机名修改成自己想要的名...

hadoop基础概念之Hadoop核心组件【图】

认知和学习Hadoop，我们必须得了解Hadoop的构成，我根据自己的经验通过Hadoop构件、大数据处理流程，Hadoop核心三个方面进行一下介绍：Hadoop组件650) this.width=650;" src="/upload/getfiles/default/2022/11/7/20221107084403110.jpg" title="Hadoop组件.png" />由图我们可以看到Hadoop组件由底层的Hadoop核心构件以及上层的Hadoop生态系统共同集成，而上层的生态系统都是基于下层的存储和计算来完成的。首先我们来了解一下核心...

基础 - 相关标签

基础编程基础架构基础类型基础数据

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook Hadoop基础知识 windows部署hadoop-2.7.0 使用 Oracle Load For Hadoop（OLH）实...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / Hadoop基础【1.1】 Writeable

Hadoop基础【1.1】 Writeable

内容导读

内容图文

源码如下

WritableComparator（54-81行）

内容总结

内容备注

内容手机端

【Hadoop基础【1.1】 Writeable】教程文章相关的互联网学习教程文章

Hadoop基础【1.1】 Writeable【代码】

Hadoop基础入门【图】

20190228 搭建Hadoop基础环境【图】

hadoop基础

【原创】大数据基础之Hadoop（3）hdfs diskbalancer【代码】

Hadoop基础-Combiner使用场景介绍

Hadoop基础【图】

[转载] 《Hadoop基础教程》之初识Hadoop【图】

Hadoop基础-HDFS的写入过程

Linux下hadoop和spark的基础环境配置准备

《Hadoop基础教程》之初识Hadoop【图】

Hadoop基础-05-HDFS项目(词频统计)【代码】

Hadoop基础（七）：HDFS的Shell操作（开发重点）【代码】【图】

大数据学习初体验：Linux学习+Shell基础编程+hadoop集群部署【代码】【图】

hadoop基础概念之Hadoop核心组件【图】

HADOOP - 相关标签

基础 - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程