首页 / JAVA / java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？

java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2256字，纯文字阅读大概需要4分钟。

内容图文

java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？

这个问题是我之前有一个问题的后续问题What happens if I cache the same RDD twice in Spark.

在RDD上调用cache()时,RDD的状态是否发生了变化(并且返回的RDD只是为了易于使用)或者创建了一个新的RDD包装现有的RDD？

以下代码中会发生什么：

// Init
JavaRDD<String> a = ... // some initialise and calculation functions.
JavaRDD<String> b = a.cache();
JavaRDD<String> c = b.cache();

// Case 1, will 'a' be calculated twice in this case 
// because it's before the cache layer:
a.saveAsTextFile(somePath);
a.saveAsTextFile(somePath);

// Case 2, will the data of the calculation of 'a' 
// be cached in the memory twice in this case
// (once as 'b' and once as 'c'):
c.saveAsTextFile(somePath);

解决方法:

When calling cache() on a RDD, does the state of the RDD changed (and
the returned RDD is just this for ease of use) or a new RDD is created
the wrapped the existing one

The same RDD is returned：

/**
 * Mark this RDD for persisting using the specified level.
 *
 * @param newLevel the target storage level
 * @param allowOverride whether to override any existing level with the new one
 */
  private def persist(newLevel: StorageLevel, allowOverride: Boolean): this.type = {
  // TODO: Handle changes of StorageLevel
  if (storageLevel != StorageLevel.NONE && newLevel != storageLevel && !allowOverride) {
    throw new UnsupportedOperationException(
      "Cannot change storage level of an RDD after it was already assigned a level")
}
  // If this is the first time this RDD is marked for persisting, register it
  // with the SparkContext for cleanups and accounting. Do this only once.
  if (storageLevel == StorageLevel.NONE) {
    sc.cleaner.foreach(_.registerRDDForCleanup(this))
    sc.persistRDD(this)
  }
  storageLevel = newLevel
  this
}

缓存不会对所述RDD造成任何副作用.如果它已标记为持久性,则不会发生任何事情.如果不是,唯一的副作用是将其注册到SparkContext,其中副作用不在RDD本身,而是在上下文中.

编辑：

看看JavaRDD.cache,似乎底层调用将导致另一个JavaRDD的分配：

/** Persist this RDD with the default storage level (`MEMORY_ONLY`). */
def cache(): JavaRDD[T] = wrapRDD(rdd.cache())

wrapRDD调用JavaRDD.fromRDD的地方：

object JavaRDD {

  implicit def fromRDD[T: ClassTag](rdd: RDD[T]): JavaRDD[T] = new JavaRDD[T](rdd)
  implicit def toRDD[T](rdd: JavaRDD[T]): RDD[T] = rdd.rdd
}

这将导致新的JavaRDD的分配.也就是说,RDD [T]的内部实例将保持不变.

内容总结

以上是互联网集市为您收集整理的java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？全部内容，希望文章能够帮你解决java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/804711.html

来源：【匿名】

【上一篇】Java web工程新手易犯的错误点【下一篇】JAVA/JSP学习系列之五

更多 ►

【java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？】教程文章相关的互联网学习教程文章

Java的开源Cache组件

其中包括OSCache、JBossCache、EHCache。OSCache功能强大，使用灵活，可用于对象缓存、 Filter缓存以及在JSP中直接使用cache标签。笔者在最近的使用过程中发现，在并发量较高时，OSCache会出现线程阻塞和数据错误，通过分析源代码发现是其内部实现的缺陷。JBossCache最大的优点是支持基于对象属性的集群同步，不过JBossCache的配置使用都较复杂，在并发量较高的情况下，对象属性数据在集群中同步也会加大系统的开销。以上两种Cac...

JavaEE框架Bootstrap HTML5 jQuery SpringMVC maven mybatis shiro ehcache SSH SSM【图】

获取【下载地址】? ?QQ: 313596790? ?【免费支持更新】A 代码生成器(开发利器);全部是源码??? ?增删改查的处理类，service层，mybatis的xml，SQL( mysql? ?和oracle)脚本,? ?jsp页面都生成? ?就不用写搬砖的代码了,生成的放到项目里，可以直接运行B 阿里巴巴数据库连接池druid;??数据库连接池??阿里巴巴的 druid。Druid在监控、可扩展性、稳定性和性能方面都有明显的优势C 安全权限框架shiro ;??Shiro 是一个用 Java 语言实现的框...

mysql 8.0 java连接报错：Unknown system variable 'query_cache_size'

java连接mysql 8.0.11报错java.sql.SQLException: Unknown system variable ‘query_cache_size‘ at com.mysql.cj.jdbc.exceptions.SQLError.createSQLException(SQLError.java:545) at com.mysql.cj.jdbc.exceptions.SQLError.createSQLException(SQLError.java:513) at com.mysql.cj.jdbc.exceptions.SQLExceptionsMapping.translateException(SQLExceptionsMapping.java:115) at com.mysql.cj.jdbc.ConnectionImpl.execSQL(Con...

memcached java client 3.0.2详解【图】

memcached-java-client-3.0.2详解一：MemCachedClient的创建创建该客户端对象的构造方法有以下几个：1,/*** Creates a new instance of MemCachedClient.*/public MemCachedClient() { this(null, true, false);}2,/*** Creates a new instance of MemCachedClient accepting a passed in pool* name.* * @param poolName* name of SockIOPool*/public MemCachedClient(String poolName) { this(poolNa...

JavaEE框架Bootstrap HTML5 jQuery SpringMVC maven mybatis shiro ehcache java web SS【图】

使用Memcached改进Java企业级应用性能：架构和设置

Memcached由Danga Interactive开发，用来提升LiveJournal.com网站性能。Memcached分布式架构支持众多的社交网络应用，Twitter、Facebook还有Wikipedia。在接下来的两部分教程中，SunilPatil介绍了Memcached分布式哈希表架构，以及利用它帮助你为数据驱动Java企业应用做数据缓存。本文介绍了如何利用Memcached提升Java企业应用性能。首先，总览了传统的Java缓存框架，并和Memcached做一个比较。当然，也会在你的本机上安装Memcached...

memcached—向memcached中保存Java实体需注意的问题【图】

今天以代码实例的形式总结一下向memcached中保存Java实体需注意的问题： memcached工具类代码：package com.ghj.packageoftool;import java.util.Date;import com.danga.MemCached.MemCachedClient; import com.danga.MemCached.SockIOPool;/*** Memcached工具类* * @author GaoHuanjie*/ public class MemcachedUtils {private static MemCachedClient memCachedClient;static {/************************************配置...

Memcached Java使用

一、Memcached安装下载Memcached的zip包，cmd切换到解压后的目录下管理员身份运行：安装：memcached.exe -d install 启动：memcached.exe -d start 关闭：memcached.exe -d stop 卸载：memcached.exe -d uninstall三、Memcached使用 1、导入java_memcached-release_x.x.x.zip包下的几个jar包（具体包先自行下...

java权限框架 SpringMVC_mybatis or hibernate+ ehcache二级缓存 +shiro+druid+bootstrap+HTML

原文：http://baidu-27167647.iteye.com/blog/2200060

基于Java IO 序列化方案的memcached-session-manager多memcached节点配置

通过nginx将请求负载均衡，而后台的几组tomcat的session通过memcached(non-sticky模式)进行统一管理，这几组tomcat部署的web app是同一应用，session的变化要统一，项目组最后采用memcached-session-manager来对tomcat的session进行管理。 session的序列化方案官方推荐的有4种java serializationmsm-kryo-serializermsm-javolution-serializermsm-xstream-serializer原文：http://www.cnblogs.com/wyh825/p/5667393.html

java权限框架 SpringMVC_mybatis or hibernate+ ehcache二级缓存 +shiro+druid+bootstrap+HTML

原文：http://hg6863.iteye.com/blog/2202420

java + memcached安装使用

一:安装(暂时先拿上手的windows做实验) 1.下载memcached.exe , 放在F:\memcached\ 下 2.在CMD下输入 "F:\memcached\memcached.exe -d install" 安装. 3.再输入："F:\memcached\memcached.exe -d start" 启动。以后memcached将作为windows的一个服务每次开机时自动启动。这样服务器端已经安装完毕了。二:java引包以下的包都是网上找的, 传说是阿里某高人封的 alisoft-xplatform-asf-cache-2.5.1.jar hessian-3.0.1.jar stax-api-1....

Java Cache模拟器（图形界面）

一、设计思路（说明，本文来自于《计算机体系结构——量化研究方法》的课程实验）1.综述我沿用了助教给的Java模版，完成了基本要求：设置Cache总大小和块大小、设置映射机制、设置替换策略、设置写策略，也完成了所有较高要求：能把Cache分为数据Cache和指令Cache、能设置预取策略、能设置写不命中调块策略并且有UI界面。在设计上我充分利用了面向对象的设计思路，把各个逻辑部件都封装成内部类，模拟各种行为的方法也封装在内部类...

Java 线程池newFixedThreadPool、newCachedThreadPoo【代码】【图】

newFixedThreadPool@Slf4j publicclass TheadPoolDemo {privatestatic ThreadPoolExecutor threadPool = (ThreadPoolExecutor) Executors.newFixedThreadPool(10);publicstaticvoid newFixedThreadPool() throws Exception {for (int i = 0; i < 2000000000; i++) {threadPool.execute(() ->{String payload = IntStream.rangeClosed(1, 90000000).mapToObj(__ -> "a").collect(Collectors.joining("")) + UUID.randomUUID().toStr...

Java内存缓存工具实现 - Guava LoadingCache【代码】

一、Guava介绍Guava是Google guava中的一个内存缓存模块，用于将数据缓存到JVM内存中。实际项目开发中经常将一些公共或者常用的数据缓存起来方便快速访问。Guava Cache是单个应用运行时的本地缓存。它不把数据存放到文件或外部服务器。如果不符合需求，可以选择Memcached、Redis等工具。二、代码示例1. POM引入<dependency><groupId>com.google.guava</groupId><artifactId>guava</artifactId><version>28.1-jre</version></depend...

首页 / JAVA / java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？

java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？

内容导读

内容图文

内容总结

内容备注

内容手机端

【java – spark中的cache()是否会改变RDD的状态或创建一个新的状态？】教程文章相关的互联网学习教程文章

Java的开源Cache组件

JavaEE框架Bootstrap HTML5 jQuery SpringMVC maven mybatis shiro ehcache SSH SSM【图】

mysql 8.0 java连接报错：Unknown system variable 'query_cache_size'

memcached java client 3.0.2详解【图】

JavaEE框架Bootstrap HTML5 jQuery SpringMVC maven mybatis shiro ehcache java web SS【图】

使用Memcached改进Java企业级应用性能：架构和设置

memcached—向memcached中保存Java实体需注意的问题【图】

Memcached Java使用

java权限框架 SpringMVC_mybatis or hibernate+ ehcache二级缓存 +shiro+druid+bootstrap+HTML

基于Java IO 序列化方案的memcached-session-manager多memcached节点配置

java权限框架 SpringMVC_mybatis or hibernate+ ehcache二级缓存 +shiro+druid+bootstrap+HTML

java + memcached安装使用

Java Cache模拟器（图形界面）

Java 线程池newFixedThreadPool、newCachedThreadPoo【代码】【图】

Java内存缓存工具实现 - Guava LoadingCache【代码】

JAVA - 相关标签

状态 - 相关标签

JAVA - 技术教程分类

JAVA - 最新教程

JAVA - 最热教程