java-如何在扩展中存储输出

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了java-如何在扩展中存储输出，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1508字，纯文字阅读大概需要3分钟。

内容图文

我正在尝试将管道输出到不同的目录,以使每个目录的输出将基于某些ID进行存储.
因此,在普通地图精简代码中,我将使用MultipleOutputs类,并在精简器中执行类似的操作.

protected void reduce(final SomeKey key,
      final Iterable<SomeValue> values,
      final Context context) {

   ...
   for (SomeValue value: values) {
     String bucketId = computeBucketIdFrom(...);
     multipleOutputs.write(key, value, folderName + "/" + bucketId);
   ...

所以我想一个人可以在烫伤中做到这一点

...
  val somePipe = Csv(in, separator = "\t",
        fields = someSchema,
        skipHeader = true)
    .read

  for (i <- 1 until numberOfBuckets) {
    somePipe
    .filter('someId) {id: String => (id.hashCode % numberOfBuckets) == i}
    .write(Csv(out + "/bucket" + i ,
      writeHeader = true,
      separator = "\t"))
  }

但是我认为您最终会多次重做同一个管道,这会影响整体性能.

还有其他选择吗？

谢谢

解决方法:

是的,使用TemplatedTsv当然是更好的方法.

因此,您的上述代码可以编写如下,

val somePipe = Tsv(in, fields = someSchema, skipHeader = true)
    .read
    .write(TemplatedTsv(out, "%s", 'some_id, writeHeader = true))

这会将来自’some_id的所有记录放入out / some_ids文件夹下的单独文件夹中.

但是,您也可以创建整数存储桶.只需更改最后几行,

.map('some_id -> 'bucket) { id: String => id.hashCode % numberOfBuckets }    
.write(TemplatedTsv(out, "%02d", 'bucket, writeHeader = true, fields = ('all except 'bucket)))

这将创建两个数字文件夹,如out / dd /.您还可以检查templatedTsv API here.

使用templatedTsv可能会有一个小问题,即reducer会生成很多小文件,这可能会对使用您的结果进行下一个工作不利.因此,最好在写入磁盘之前对模板字段进行排序.我写了一个关于它的博客here.

内容总结

以上是互联网集市为您收集整理的java-如何在扩展中存储输出全部内容，希望文章能够帮你解决java-如何在扩展中存储输出所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/690171.html

来源：【匿名】

【上一篇】java-通过Maven下载本地存储库jar依赖文件【下一篇】JAVA/JSP学习系列之五

更多 ►

【java-如何在扩展中存储输出】教程文章相关的互联网学习教程文章

Map<String, Object> bindinfo = new HashMap<String, Object>(); bindinfo.put("loginid", loginid); bindinfo.put("loginrole", loginrole); bindinfo.put("cardnumber", cardnumber); bindinfo.put("ret", new Integer("0"));//这是返回值 try{　　　　//此处调用 session.selectOne("tscargo.entity.ILocation.insert_ts_comm_pay_member", bindinfo);...

【HANA系列】【第六篇】SAP HANA XS使用JavaScript(JS)调用存储过程(Procedures)【代码】【图】

公众号：SAP Technical本文作者：matinal原文出处：http://www.cnblogs.com/SAPmatinal/ 原文链接：【HANA系列】【第六篇】SAP HANA XS使用JavaScript(JS)调用存储过程(Procedures) 前言部分大家可以关注我的公众号，公众号里的排版更好，阅读更舒适。正文部分前面几篇讲了SAP HANA XS JavaScript（JS）的基础内容和相应API，这篇讲一下JavaScript如何与后台交互，此篇讲存储过程（Procedures）。从SAP HANA XS服务器端JavaScript...

Java基础知识强化之集合框架笔记23：ArrayList存储字符串并遍历【代码】【图】

1. ArrayList存储字符串并遍历2. 代码示例： 1package cn.itcast_01;2 3import java.util.ArrayList;4import java.util.Iterator;5 6/* 7 * List的子类特点：8 * ArrayList:9 * 底层数据结构是数组，查询快，增删慢 10 * 线程不安全，效率高 11 * Vector: 12 * 底层数据结构是数组，查询快，增删慢 13 * 线程安全，效率低 14 * LinkedList: 15 * ...

Java调用存储过程时报 The user specified as a definer ('root'@'%') does not exist 解决方法

Caused by: java.sql.SQLException: The user specified as a definer (‘‘@‘‘) does not exist at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1075) at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3566) at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3498) at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1959) at com.mysql.jdbc.MysqlIO...

java+内存分配及变量存储位置的区别

Java内存分配与管理是Java的核心技术之一，之前我们曾介绍过Java的内存管理与内存泄露以及Java垃圾回收方面的知识，今天我们再次深入Java核心，详细介绍一下Java在内存分配方面的知识。一般Java在内存分配时会涉及到以下区域：　　◆寄存器：我们在程序中无法控制　　◆栈：存放基本类型的数据和对象的引用，但对象本身不存放在栈中，而是存放在堆中（new 出来的对象）　　◆堆：存放用new产生的数据　　◆静态域：存放在对象中用s...

opengl中的Floatbuffer和IntBuffer与java中数据的存储方式不同的解决方法【代码】

android OpenGL ES的书中使用了下面代码：1）创建三个顶点private IntBuffer triggerBuffer = IntBuffer.wrap(new int[]{ 0,one,0, 　 -one,-one,0, one,-one,0, }); 2）然后使用triggerBuffer 画顶点例如：gl.glVertexPointer(3, GL10.GL_FIXED, 0,triggerBuffer );经常会出现：Must use a native order direct Buffer的错误。/* * OpenGL 是一个非常底层的画图接口，它所使用的缓冲区存储结构...

tinkerpop（2）使用java调用tinkerpop，存储到derby数据库【代码】【图】

1，关于tinkerpop本文原文连接: http://blog.csdn.net/freewebsys/article/details/46470651 转载请注明出处！之前体验了下tinkerpop的console服务。存储数据，然后进行查询数据。之前写的文章： http://blog.csdn.net/freewebsys/article/details/463489752，关于blueprints Blueprints是一组针对属性图数据模型的接口、实现、测试套件，有些类似于JDBC，不同之处在于Blueprints是针对图形数据库的。Blueprints提供了一组通用...

java对象存储管理

java程序在内存中的存储分配情况：堆区: 1.存储的全部是对象，每个对象都包含一个与之对应的class的信息。(class的目的是得到操作指令) 2.jvm只有一个堆区(heap)被所有线程共享，堆中不存放基本类型和对象引用，只存放对象本身栈区: 1.每个线程包含一个栈区，栈中只保存基础数据类型的对象和自定义对象的引用(不是对象)，对象都存放在堆区中 2.每个栈中的数据(原始类型和对象引用)都是私有的，其他栈不能访问。 3.栈分为3个...

在java中调用Oracle存储过程【代码】

在java中调用Oracle存储过程本文介绍如何通过java来调用Oracle的存储过程 1. 编写存储过程CREATEOR REPLACE PROCEDUREsp_pro3(sp_name VARCHAR2,sp_sal NUMBER )ISBEGIN--根据用户名修改工资UPDATEempSETsal=sp_salWHEREename=sp_name;END;引入jdbc6.jar，编写测试类Test.javapackage testOraclePro;import java.sql.CallableStatement; import java.sql.Connection; import java.sql.DriverManager;publicclassTest {publicstat...

JavaScript——WEBAPIS_有关于移动端特效，还有本地存储【代码】

关于移动端的js特效话题注意以下移动端的js开发，我们一般的开发做法就是使用第三方js框架或者插件去开发，有线考虑一下插件，而不是框架。不太会去写原生的js，因为实在是太过于麻烦了有关于本地存储本地存储的话题随着互联网的快速发展，基于网页的应用越来越普遍，同时也变的越来越复杂，为了满足各种各样的需求，会经常性在本地存储大量的数据，HTML5规范提出了相关解决方案。本地存储特性1、数据存储在用户浏览器中2、设置、...

数据存储 --《高性能JavaScript》

1.数据存储的方式　　1.字面量　　2.变量　　3.数组项　　4.对象成员2.各自的性能特点　　1.访问字面量和局部变量的速度最快，访问数组项和对象成员相对较慢　　2.由于局部变量在作用域链的起始位置，因此访问局部变量比访问跨作用域变量更快。变量在作用域链的位置越深，访问的时间就越长。　　3.避免使用with和try-catch语句，因为他会改变作用域链，会影响性能。　　4.嵌套的对象成员会明显影响性能。　　5.属性和方法在原型链上...

java 16 -11 ArrayList存储自定义对象并增强for遍历【代码】

需求：ArrayList存储自定义对象并遍历。要求加入泛型，并用增强for遍历。　　　　A:迭代器　　　　B:普通for 　　 C:增强for LinkedList,Vector,Colleciton,List等存储继续练习增强for是用来替迭代器。 1package cn_JDK5new;2 3import java.util.ArrayList;4import java.util.Iterator;5 6 7publicclass ArrListDemo2 {8publicstaticvoid main(String[] args) {9//创建集合注意：这里是存储自定义对象，则类...

第三十六节（Java-jdbc高级运用-存储过程调用）【代码】

GuestInfoBean.java文件：package com.tanzhou.date; /*** 数据表实体类 - tb_guestinfo* @author Ming* @version 1.0*/publicclass GuestInfoBean {private Integer id; // ‘编号‘,private String guestname; //‘访客姓名‘,private String guesttel; //‘连联电话‘,private String indate; //‘来访时间‘,private String outdate; //‘离开时间‘,private String remark; // ‘备注信息‘,public Integer getId() {return i...

java基础第22天_mysql存储过程、事务隔离

断点续传、QQ等项目的数据保存在数据库中实现。本文出自 “作业” 博客，请务必保留此出处http://10718270.blog.51cto.com/10708270/1793274原文：http://10718270.blog.51cto.com/10708270/1793274

java javabean和List存储表格数据(用List存储类)【代码】

javabean一个具有完整的set和get方法，还有一个空构造器的类 class User{private int id;private double salary;private String name;private String hiredate;public User(){}public User(int id, double salary, String name, String hiredate) {super();this.id = id;this.salary = salary;this.name = name;this.hiredate = hiredate; }public int getId() {return id; } public void setId(int id) {this.id = id; } public d...

JAVA - 技术教程分类

Java 教程 Java 简介 Java 开发环境配置 Java 基础语法 Java 对象和类 Java 基本数据类型 Java 变量类型 Java 修饰符 Java 运算符 Java 循环结构 Java 条件语句 Java switch case Java Number & Math 类 Java Character 类 Java String 类 Java StringBuffer Java 数组 Java 日期时间 Java 方法 Java Stream、File、IO Java Scanner 类 Java 异常处理 Java 继承 Java Override/Overload Java 多态 Java 抽象类 Java 封装 Java 接口 Java 枚举 Java 包(package) Java 数据结构 Java 集合框架 Java ArrayList Java LinkedList Java HashSet Java HashMap Java Iterator Java Object Java 泛型 Java 序列化 Java 网络编程 Java 多线程编程 Java Applet 基础 Java 文档注释 Java 实例 Java 8 新特性 Java MySQL 连接 Java 9 新特性 Java 测验 java 全部

JAVA - 最热教程

Java在运行项目时候，点击右键的弹框，...nacos配置中心超时问题：java.net.Conn...Java的设计模式（7）— 生产者-消费者模...基于DOM4j和POI实现的XML文件转换为XLS...如何在Java中创建一些变量类型别名使用java8的Stream统计字符串数组中每一...idea插件篇之java内存分析工具(JProfil...cannot cast 'java.lang.Integer' to '...java – Bootstrap.properties中Spring...Java8利用stream流实现数字排序和中文排...

首页 / JAVA / java-如何在扩展中存储输出

java-如何在扩展中存储输出

内容导读

内容图文

内容总结

内容备注

内容手机端

【java-如何在扩展中存储输出】教程文章相关的互联网学习教程文章

java, mybatis, 调用mysql存储过程

【HANA系列】【第六篇】SAP HANA XS使用JavaScript(JS)调用存储过程(Procedures)【代码】【图】

Java基础知识强化之集合框架笔记23：ArrayList存储字符串并遍历【代码】【图】

Java调用存储过程时报 The user specified as a definer ('root'@'%') does not exist 解决方法

java+内存分配及变量存储位置的区别

opengl中的Floatbuffer和IntBuffer与java中数据的存储方式不同的解决方法【代码】

tinkerpop（2）使用java调用tinkerpop，存储到derby数据库【代码】【图】

java对象存储管理

在java中调用Oracle存储过程【代码】

JavaScript——WEBAPIS_有关于移动端特效，还有本地存储【代码】

数据存储 --《高性能JavaScript》

java 16 -11 ArrayList存储自定义对象并增强for遍历【代码】

第三十六节（Java-jdbc高级运用-存储过程调用）【代码】

java基础第22天_mysql存储过程、事务隔离

java javabean和List存储表格数据(用List存储类)【代码】

JAVA - 相关标签

JAVA - 技术教程分类

JAVA - 最新教程

JAVA - 最热教程