首页 / REDIS / kafka-spark偏移量提交至redis kafka1.0版本

kafka-spark偏移量提交至redis kafka1.0版本

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了kafka-spark偏移量提交至redis kafka1.0版本，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5811字，纯文字阅读大概需要9分钟。

内容图文

kafka版本 1.0.0

spark版本 spark-streaming-kafka-0-10_2.11

class KafkaManagerByRedis(kafkaParams: Map[String, Object]) extends Serializable {


  private val jedis = JedisUtil.getInstance().getJedis
  
  /**
    * def createDirectStream:InputDStream
    **/

  def createDirectStream[K: ClassTag, V: ClassTag](ssc: StreamingContext, topics: Seq[String]): InputDStream[ConsumerRecord[K, V]] = {
    //1:readOffset
    val groupId = kafkaParams("group.id").toString
    val topic = topics(0)
    val redisKey = topic + ":" + kafkaParams("group.id").toString

    val offsetInfo = jedis.hgetAll(redisKey)
    val stream: InputDStream[ConsumerRecord[K, V]] =
      if ( offsetInfo.size() == 0) {
        val newKafkaParams = mutable.Map[String, Object]()
        newKafkaParams ++= kafkaParams
        newKafkaParams.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest")
        //     程序第一次启动
        KafkaUtils.createDirectStream[K, V](
          ssc,
          PreferConsistent,
          Subscribe[K, V](topics, newKafkaParams)
        )
      } else {
//        val topicPartition: Map[TopicPartition, Long] = readOffset(topic, groupId)
//        //2:KafkaUtils.createDirectStream ---> InputDStream
//        KafkaUtils.createDirectStream[K, V](
//          ssc,
//          PreferConsistent,
//          ConsumerStrategies.Subscribe[K, V](topics, kafkaParams, topicPartition)

        val newKafkaParams = mutable.Map[String, Object]()
        newKafkaParams ++= kafkaParams
        newKafkaParams.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest")
        //     程序第一次启动
        KafkaUtils.createDirectStream[K, V](
          ssc,
          PreferConsistent,
          Subscribe[K, V](topics, newKafkaParams)
        )
      }

    stream
  }

  /**
    * 读取偏移量
    *
    * @param topics
    * @param groupId 消费组
    * @return Map[car-1 , car-2 , Long]
    **/

  private def readOffset(topic: String, groupId: String): Map[TopicPartition, Long] = {
    val topicPartitionMap = collection.mutable.HashMap.empty[TopicPartition, Long]
    //拿topic和分区信息
    /**
      * 在redis中进行 存储 topic_consumerId：partition,offset
      */
    val redisKey = topic + ":" + kafkaParams("group.id").toString
    val map: util.Map[String, String] = jedis.hgetAll(redisKey)
    val topicAndPartitionMaps: mutable.Map[String, String] = mapAsScalaMap(map)
    topicAndPartitionMaps.foreach(partitionAndOffset => {
      //将topic 、分区、偏移量返回出去
      topicPartitionMap.put(new TopicPartition(topic, Integer.valueOf(partitionAndOffset._1.toInt)), partitionAndOffset._2.toLong)
    })
    //currentoffset 、 earliestoffset  leatestOffset
    //cur < ear || cur > leaty ==> 矫正-->  ear
    //TODO 矫正
    val earliestOffsets = getEarliestOffsets(kafkaParams, topic)
    val topics = List(topic)
    val latestOffsets = getLatestOffsets(kafkaParams, topics)
    for ((k, v) <- topicPartitionMap) {
      val current = v
      val earliest = earliestOffsets.get(k).get
      val latest = latestOffsets.get(k).get
      if (current < earliest || current > latest) {
        topicPartitionMap.put(k, earliest)
      }
    }
    topicPartitionMap.toMap
  }


  /**
    * 获取最早的偏移量
    *
    * @param kafkaParams
    * @param topics
    * @return
    */
  private def getEarliestOffsets(kafkaParams: Map[String, Object], topic: String) = {
    val newKafkaParams = mutable.Map[String, Object]()
    newKafkaParams ++= kafkaParams
    newKafkaParams.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest")
    //kafka api
    val consumer = new KafkaConsumer(kafkaParams)
    //订阅
    val topics = Seq[String](topic)
    consumer.subscribe(topics)
    val noOffsetForPartitionExceptionSet: mutable.Set[Nothing] = mutable.Set()
    try {
      consumer.poll(0)
    } catch {
      case e: NoOffsetForPartitionException =>
      //        noOffsetForPartitionExceptionSet.add(e.partition())
      //邮件报警
    }
    //获取 分区信息
    val topicp = consumer.assignment().toSet
    //暂定消费
    consumer.pause(topicp)
    //从头开始
    consumer.seekToBeginning(topicp)
    val toMap = topicp.map(line => line -> consumer.position(line)).toMap
    val earliestOffsetMap = toMap
    consumer.unsubscribe()
    consumer.close()
    earliestOffsetMap
  }


  private def getLatestOffsets(kafkaParams: Map[String, Object], topic: Seq[String]) = {
    val newKafkaParams = mutable.Map[String, Object]()
    newKafkaParams ++= kafkaParams
    newKafkaParams.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "latest")

    //kafka api
    val consumer = new KafkaConsumer[String, Array[Byte]](newKafkaParams)
    //订阅
    consumer.subscribe(topic)
    val noOffsetForPartitionExceptionSet = mutable.Set()
    try {
      consumer.poll(0)
    } catch {
      case e: NoOffsetForPartitionException =>
      //        noOffsetForPartitionExceptionSet.add(e.partition())
      //邮件报警
    }
    //获取 分区信息
    val topicp = consumer.assignment().toSet
    //暂定消费
    consumer.pause(topicp)
    //从尾开始
    consumer.seekToEnd(topicp)
    val toMap: Map[TopicPartition, Long] = topicp.map(line => line -> consumer.position(line)).toMap
    val earliestOffsetMap = toMap
    consumer.unsubscribe()
    consumer.close()
    earliestOffsetMap
  }


  def persistOffset[K, V](rdd: RDD[ConsumerRecord[K, V]], storeOffset: Boolean = true, topic: String) = {

    val groupId = kafkaParams("group.id").toString

    val offsetRanges: Array[OffsetRange] = rdd.asInstanceOf[HasOffsetRanges].offsetRanges

    offsetRanges.foreach(offsetRange => {
      val redisKey = offsetRange.topic + "_" + groupId
      val data = if (storeOffset) offsetRange.untilOffset else offsetRange.fromOffset
      jedis.hset(redisKey, offsetRange.partition.toString, data.toString)
      println("topic:" + offsetRange.topic + "分区:" + offsetRange.partition + "开始消费" + offsetRange.fromOffset + "消费到" + offsetRange.untilOffset + "共计" + offsetRange.count())
    })


  }

内容总结

以上是互联网集市为您收集整理的kafka-spark偏移量提交至redis kafka1.0版本全部内容，希望文章能够帮你解决kafka-spark偏移量提交至redis kafka1.0版本所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/878810.html

来源：【匿名】

【上一篇】Redis 有序集合(sorted set)【下一篇】redis可以做什么？

更多 ►

【kafka-spark偏移量提交至redis kafka1.0版本】教程文章相关的互联网学习教程文章

大数据架构培训视频教程 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis 云计算【图】

培训大数据架构开发！从零基础到高级，手把手培训！[技术QQ：2937765541]? ?----------------------------------------------------------------------------------------------------------------------------------课程目录：获取视频资料和培训解答技术支持地址?课程展示(永久免费更新！永久免费培训解答技术支持！)：获取视频资料和培训解答技术支持地址?原文：http://twskyn.iteye.com/blog/2289784

springboot-web项目（从spring mvc-web迁移过来的）多数据源，mybatis,redis,kafka配置【代码】【图】

1. 首先使用idea创建一个springboot-web的壳子2. 将原工程的代码搬到新工程上（后端代码部分）3. 将静态资源搬到resource目录下，其中templates下面放的ftl文件before after:4. 配置文件application.properties：多数据库，mybatis, redis, kafka, freemakerspring.application.name=myapp server.port=18080spring.velocity.enabled=true spring.velocity.prefix= spring.velocity.suffix=.vm spring.velocity.cache=false sp...

安装redis和kafka的

一,添加硬盘1>挂载好新硬盘后输入fdisk -l命令看当前磁盘信息2>可以看到除了当前的第一块硬盘外还有一块sdb的第二块硬盘，然后用fdisk /dev/sdb 进行分区3>进入fdisk命令，输入h可以看到该命令的帮助，按n进行分区4>这里输入e即分为逻辑分区，按p即分为主分区，我们要将这块盘分为主分区即输入p5>到这里输入该主分区为第几个主分区，由于是新盘我们输入1来分第一个主分区6>First Cylinder是选择该分区的起始磁盘数，这里可自定义也...

centos 7磁盘空间满了导致redis cluster问题和kafka的问题

发现java的日志里面老是报错如下日志，还有kafka的消费者收不到消息，看来docker logs kafka日志如下：原因估计是12月23日那天磁盘空间满了，导致redis和kafka异常解决方法：重启了redis的这个节点172.18.144.94:7006重启了kafka就ok了如下是redis cluster的报错 2020-01-16 17:10:00.098 pool-8-thread-3 ERROR com.hp.nova.common.todayuseronline.UserOnlineScheduleJob.userOnlineScheduleJob(UserOnlineScheduleJob.java...

2021年Java高频面试题分享（中高级版）：JVM+Redis+Kafka +数据库+设计模式【图】

话不多说，这些都是这几年来BATJ面试问的最多关于Java的面试题，大家可以以这个为标准！多做准备！帮忙转发一下，关注后添加助理vx：yunduoa2019或扫描下图二维码，跟随助理指引自行获取Mysql 与 Oracle 相比， Mysql 有什么优势？简洁描述 Mysql 中 InnoDB 支持的四种事务隔离级别名称，以及逐级之间的区别？在 Mysql 中 ENUM 的用法是什么？Mysql 中使用什么存储引擎？如何使用 Unix shell 登录 MysqlMysql 中有哪几种锁？简单介...

BATJ高级Java面试题分享：JVM+Redis+Kafka +数据库+设计模式【图】

话不多说，直接上面试题，来看一下你还欠缺多少？ Mysql 与 Oracle 相比， Mysql 有什么优势？简洁描述 Mysql 中 InnoDB 支持的四种事务隔离级别名称，以及逐级之间的区别？在 Mysql 中 ENUM 的用法是什么？ Mysql 中使用什么存储引擎？如何使用 Unix shell 登录 Mysql Mysql 中有哪几种锁？简单介绍一下 JVM GC 的三种收集方法：标记清除、标记整理、复制算法的原理与特点，分别用在什么地方，如果让你优化收集方法，有什么思路...

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算【图】

从零基础到高级，一对一培训！[技术QQ：2937765541] ------------------------------------------------------------------------------------------------------------------------------------------- 课程体系：获取视频资料和培训解答技术支持地址课程展示(大数据技术很广，一直在线为你培训解答！)：获取视频资料和培训解答技术支持地址大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeep...

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算视频教程 Java互联网架构师【图】

从零基础到高级，一对一技术培训！全程技术指导！[技术QQ：2937765541] https://item.taobao.com/item.htm?id=535950178794 ------------------------------------------------------------------------------------- Java互联网架构师培训！https://item.taobao.com/item.htm?id=536055176638大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算视频教程 Java互...

对于mysql，redis，Kafka，zookeeper磁盘缓存技术使用分析【图】

对于mysql，redis，Kafka，zookeeper磁盘缓存技术使用分析大部分组件是基于磁盘存储的，但由于CPU速度和磁盘速度之间的鸿沟，都会使用缓存技术来提高性能，缓存简单来说就是一块内存区域，首先将从磁盘读到的数据放在缓存中，之后查询或修改时直接操作缓存，对于缓存中的数据则以一定的频率刷新到磁盘上，怎样缓存，缓存多少，何时刷新，这些影响着整个组件的性能。在看过一些关于mysql等组件的架构原理后，会发现不论是基于磁盘的...

阿里架构师纯手写java面试宝典：spring/Redis/数据/Kafka/微服务，就问还有谁？【图】

Java的诞生已经超过了20年。一直以来，Java以其语法简单，开发者可以快速上手，适应众多领域，具有跨平台能力等特性，吸引了无数程序员学习和使用。基于Java优秀的特性和庞大的使用基础，各大公司对Java工程师的需求也是源源不断。但作为面试者，想进入BAT并成长为一名高级Java工程师却没那么容易。虽然面试者具备了一定的工作年限要求，也长期使用Java语言进行开发，但面试时，面对刨根问底的提问，经常感觉get不到面试官的点，自...

SpringCloud+Nacos+Mybatis+Redis+Kafka 微服务整套框架环境搭建【代码】【图】

作为一个架构师，首先项目框架必须是要会搭建的。今天就来介绍线上的框架搭建，注意不是学习。用到的技术 maven构建整合springboot+mybatis+redis+kafka整合springcloud+nacos 搭建步骤 uc-parent工程新建一个 uc-parent（uc可以是自己公司的简称） maven 聚合父工程，用来统一jar包版本管理。里面就一个pom文件: pom.xml ? 注意修改下repository标签，改成自己的仓库地址失效了的话可以联系我，工程结构图:order 聚合工程 orde...

redis也可以实现队列，为什么还要用rabitmq或者kafka?

如题。你们的队列是怎么用？我是这么用的，一个生产，然后后台跑了crontab定时跑队列里面的内容。这个是我面试的时候面试官问我的，他就对我说你这么用不对，队列不是这么用，他说你要用crontab跑队列，哪和用数据库做个队列没啥区别。但我确实是这么用，我又没好意思问他怎么才是对的。。。。各位种大神你们是怎么用的啊？回复内容：如题。你们的队列是怎么用？我是这么用的，一个生产，然后后台跑了crontab定时跑队列里面的内容...

大数据平台架构（flume＋kafka＋hbase＋ELK+storm+redis+mysql）【代码】【图】

download.oracle.com/otn-pub/java/jdk/8u45-b14/jdk-8u45-linux-x64.tar.gztar zxvf jdk-8u45-linux-x64.tar.gz cd jdk-8u45-linux-x64 sudo vi /etc/profile添加如下内容： export JAVA_HOME=/home/dir/jdk1.8.0_45 export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export PATH=$PATH:$JAVA_HOME/bin安装 Python sudo apt-get install python安装 zookeeper wget http://mirror.b...

Spark如何写入HBase/Redis/MySQL/Kafka【代码】

private val DEFAULT_ZOOKEEPER_QUORUM = "127.0.0.1:2181"private lazy val (table, conn) = createConnectiondef bulk(items:Iterator) = {items.foreach(conn.put(_))conn.flush....} ...... }然后保证这个类在map,foreachRDD等函数下使用，譬如：dstream.foreachRDD{ rdd =>rdd.foreachPartition{iter=>SimpleHBaseClient.bulk(iter) } }为什么要保证放到foreachRDD/map 等这些函数里呢？Spark的机制是先将用户的程序作为一个...

kafka与redis的区别有哪些【图】

kafka与redis的区别： 1、redis消息推送（基于分布式 pub/sub）多用于实时性较高的消息推送，并不保证可靠。其他的mq和kafka保证可靠但有一些延迟（非实时系统没有保证延迟）。redis-pub/sub断电就清空，而使用redis-list作为消息推送虽然有持久化，但是又太弱智，也并非完全可靠不会丢。2、redis 发布订阅除了表示不同的 topic 外，并不支持分组，比如kafka中发布一个东西，多个订阅者可以分组，同一个组里只有一个订阅者会收到该...

REDIS - 技术教程分类

Redis 教程 Redis 简介 Redis 安装 Redis 配置 Redis 数据类型 Redis 命令 Redis 键(key) Redis 字符串(String) Redis 哈希(Hash) Redis 列表(List) Redis 集合(Set) Redis 有序集合(sorted set) Redis HyperLogLog Redis 发布订阅 Redis 事务 Redis 脚本 Redis 连接 Redis 服务器 Redis GEO Redis Stream Redis 数据备份与恢复 Redis 安全 Redis 性能测试 Redis 客户端连接 Redis 分区 Redis 全部

REDIS - 最热教程

redis中批量删除key的方法 redis设置密码，取消密码 node.js利用redis数据库缓存数据 PHP swoole和redis异步任务实现方法分析 Laravel使用Redis共享Session步骤详解 mac下卸载干净redis 如何通过命令行修改redis的配置使用Port Forwarding连接k8s集群的pod（...Redis入门（七）——Redis发布订阅 Redis学习笔记2-常用数据类型

首页 / REDIS / kafka-spark偏移量提交至redis kafka1.0版本

kafka-spark偏移量提交至redis kafka1.0版本

内容导读

内容图文

内容总结

内容备注

内容手机端

【kafka-spark偏移量提交至redis kafka1.0版本】教程文章相关的互联网学习教程文章

大数据架构培训视频教程 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis 云计算【图】

springboot-web项目（从spring mvc-web迁移过来的）多数据源，mybatis,redis,kafka配置【代码】【图】

安装redis和kafka的

centos 7磁盘空间满了导致redis cluster问题和kafka的问题

2021年Java高频面试题分享（中高级版）：JVM+Redis+Kafka +数据库+设计模式【图】

BATJ高级Java面试题分享：JVM+Redis+Kafka +数据库+设计模式【图】

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算【图】

大数据架构开发挖掘分析 Hadoop HBase Hive Storm Spark Sqoop Flume ZooKeeper Kafka Redis MongoDB 机器学习云计算视频教程 Java互联网架构师【图】

对于mysql，redis，Kafka，zookeeper磁盘缓存技术使用分析【图】

阿里架构师纯手写java面试宝典：spring/Redis/数据/Kafka/微服务，就问还有谁？【图】

SpringCloud+Nacos+Mybatis+Redis+Kafka 微服务整套框架环境搭建【代码】【图】

redis也可以实现队列，为什么还要用rabitmq或者kafka?

大数据平台架构（flume＋kafka＋hbase＋ELK+storm+redis+mysql）【代码】【图】

Spark如何写入HBase/Redis/MySQL/Kafka【代码】

kafka与redis的区别有哪些【图】

REDIS - 相关标签

REDIS - 技术教程分类

REDIS - 最新教程

REDIS - 最热教程