首页 / 更多教程 / JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例

JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3259字，纯文字阅读大概需要5分钟。

内容图文

JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例

1.编写给ResultSet添加spark的schema成员及DF（DataFrame）成员

/*
    spark、sc对象因为是全局的，没有导入，需自行定义
    teradata的字段类型转换成spark的数据类型
*/

import java.sql.{ResultSet, ResultSetMetaData}

import org.apache.spark.sql.types._
import org.apache.spark.sql.{DataFrame, Row}

object addDataframeMember {

  trait ResultSetMetaDataToSchema {
    def columnCount: Int

    def schema: StructType
  }

  implicit def wrapResultSetMetaData(rsmd: ResultSetMetaData) = {
    new ResultSetMetaDataToSchema {
      def columnCount = rsmd.getColumnCount

      def schema = {
        def tdCovert(tdDpeStr: String, precision: Int = 0, scale: Int = 0, className: String = ""): DataType = {
          tdDpeStr match {
            case "BYTEINT" => IntegerType
            case "SMALLINT" => ShortType
            case "INTEGER" => IntegerType
            case "BIGINT" => LongType
            case "FLOAT" => DoubleType
            case "CHAR" => CharType(precision)
            case "DECIMAL" => DecimalType(precision, scale)
            case "VARCHAR" => StringType
            case "BYTE" => ByteType
            case "VARBYTE" => ByteType
            case "DATE" => DateType
            case "TIME" => TimestampType
            case "TIMESTAMP" => TimestampType
            case "CLOB" => StringType
            case "BLOB" => BinaryType
            case "Structured UDT" => ObjectType(Class.forName(className))
          }
        }

        def col2StructField(rsmd: ResultSetMetaData, i: Int): StructField = StructField(rsmd.getColumnName(i), tdCovert(rsmd.getColumnTypeName(i), rsmd.getPrecision(i), rsmd.getScale(i), rsmd.getColumnClassName(i)), rsmd.isNullable(i) match { case 1 => true case 0 => false }).withComment(rsmd.getColumnLabel(i))

        def rsmd2Schema(rsmd: ResultSetMetaData): StructType = (1 to columnCount).map(col2StructField(rsmd, _)).foldLeft(new StructType)((s: StructType, i: StructField) => s.add(i))

        rsmd2Schema(rsmd)
      }
    }
  }

  trait ResultSetToDF {
    def schema: StructType

    def DF: DataFrame
  }

  implicit def wrapResultSet(rs: ResultSet) = {
    def rsmd = rs.getMetaData

    def toList[T](retrieve: ResultSet => T): List[T] = Iterator.continually((rs.next(), rs)).takeWhile(_._1).map(r => r._2).map(retrieve).toList

    def rsContent2Row(rs: ResultSet): Row = Row.fromSeq(Array.tabulate[Object](rsmd.columnCount)(i => rs.getObject(i + 1)).toSeq)

    new ResultSetToDF {
      def schema = rsmd.schema

      def DF = spark.createDataFrame(sc.parallelize(toList(rsContent2Row)), schema)
    }

  }


}

2.正常基于JDBC连接并且获得数据集游标

import java.sql.{Connection, DriverManager}

/*
    获取TeraData的连接
*/

val (dialect, host, user, passwd, database, charset) = ("teradata", "ip", "user", "password", "database", "ASCII")
val tdConf = collection.immutable.Map(
  "driver" -> "com.ncr.teradata.TeraDriver",
  "uri" -> s"jdbc:$dialect://$host/CLIENT_CHARSET=EUC_CN,TMODE=TERA,COLUMN_NAME=ON,CHARSET=ASCII,database=$database",
  "username" -> user,
  "password" -> passwd
)

def getTeraConn: Connection = {
  Class.forName(tdConf("driver"))
  DriverManager.getConnection(tdConf("uri"), tdConf("username"), tdConf("password"))
}
val sql = "SELECT TOP 10 * FROM xxx"
var conn = getTeraConn
val stmt = conn.createStatement()
val rs = stmt.executeQuery(sql)

3.导入隐式转换，调用成员

import addDataframeMember.wrapResultSet
rs.DF.show()

JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例

标签：har lse typename 编写 nec scala etc sci long

本文系统来源：https://www.cnblogs.com/shld/p/11803503.html

内容总结

以上是互联网集市为您收集整理的JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例全部内容，希望文章能够帮你解决JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/514820.html

来源：【匿名】

【上一篇】安装moogodb 【下一篇】关于IE的RegExp.exec的问题

更多 ►

【JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例】教程文章相关的互联网学习教程文章

JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例【代码】

1.编写给ResultSet添加spark的schema成员及DF（DataFrame）成员/*spark、sc对象因为是全局的，没有导入，需自行定义teradata的字段类型转换成spark的数据类型 */import java.sql.{ResultSet, ResultSetMetaData}import org.apache.spark.sql.types._ import org.apache.spark.sql.{DataFrame, Row}object addDataframeMember {trait ResultSetMetaDataToSchema {def columnCount: Intdef schema: StructType}implicit def wrapResu...

sparkSQL中RDD——DataFrame——DataSet的区别

spark中RDD、DataFrame、DataSet都是spark的数据集合抽象，RDD针对的是一个个对象,但是DF与DS中针对的是一个个Row RDD 优点: 编译时类型安全编译时就能检查出类型错误面向对象的编程风格直接通过类名点的方式来操作数据缺点: 序列化和反序列化的性能开销无论是集群间的通信,还是IO操作都需要对对象的结构和数据进行序列化和反序列化 GC的性能开销,频繁的创建和销毁对象,势必会增加GC开销 DataFra...

07 从RDD创建DataFrame【图】

0.前次作业：从文件创建DataFrame 1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 答：（1）代码：（2）运行结果：2. Spark与Pandas中DataFrame对比答：http://www.lining0806.com/spark%E4%B8%8Epandas%E4%B8%ADdataframe%E5%AF%B9%E6%AF%94/ 3.1 利用反射机制推断RDD模式sc创建RDD 转换成Row元素，列名=值 spark.createDataFrame生成df df.show(), df.printSchema()答：（1）代码：...

DataFrame与数据库的相互转化

在Spark中，Dataframe简直可以称为内存中的文本文件。就像在电脑上直接操作txt、 csv、 json文件一样简单。 val sparkConf = new SparkConf().setAppName("df2db").setMaster("local[1]") val sc = new SparkContext(sparkConf) val sqlContext : SQLContext = new SQLContext(sc) val df = sqlContext.read.format("csv").option("header","true").load("D:\\spark test\\123") val snapTable = "env0y" df.registerTempTable(...

pandas中Series和Dataframe数据类型互转【代码】【图】

pandas中Series和Dataframe数据类型互转pandas中series和dataframe数据类型互转利用to_frame()实现Series转DataFrame利用squeeze()实现单列数据DataFrame转Series s = pd.Series([1,2,3])s0 1 1 2 2 3 dtype: int64s = s.to_frame(name="列名")s 列名011223 s.squeeze()0 1 1 2 2 3 Name: 列名, dtype: int64到这里就结束了，如果对你有帮助，欢迎点赞关注评论，你的点赞对我很重要

spark sql 之 RDD与DataFrame互相转化【代码】

一、RDD转DataFrame方法一：通过 case class 创建 DataFramesimport org.apache.spark.SparkConf import org.apache.spark.SparkContext import org.apache.spark.sql.SQLContextobject TestDataFrame {def main(args: Array[String]): Unit = {/*** 1、初始化 spark config*/val conf = new SparkConf().setAppName("TestDataFrame").setMaster("local"); /*** 2、初始化spark context*/val sc = new SparkContext(conf);/*** ...

新建一个空的DataFrame 表头与旧DataFrame 一致【代码】

newdf = pd.DataFrame(data=None, columns=olddf.columns) #其中olddf是先前处理完毕的数据 #不使用copy()是因为newdf中不需要所有olddf中的数据，而是需要根据条件筛选并添加 for i in range(...):tmpdf = ... #按条件筛选操作newdf.append(tmpdf)

成功解决ValueError: DataFrame.dtypes for data must be int, float or bool. Did not expect the data types

成功解决ValueError: DataFrame.dtypes for data must be int, float or bool. Did not expect the data types in fields datetime64[ns]_col 目录解决问题解决思路解决方法解决问题 ValueError: DataFrame.dtypes for data must be int, float or bool. Did not expect the data types in fields datetime64[ns]_col 解决思路值错误:DataFrame.dtypes必须为int, float或bool。没有期

SparkRDD转DataSet/DataFrame的一个深坑【代码】

SparkRDD转DataSet/DataFrame的一个深坑半个橙子丶大数据技术与架构场景描述：本文是根据读者反馈的一个问题总结而成的。关键词：Saprk RDD原需求：希望在map函数中将每一个rdd转为DataSet或者DataFrame。 SparkRDD转为DataSet的两种方式第一种方法是使用反射来推断包含特定对象类型的RDD的模式。在写Spark程序的同时，已经知道了模式，这种基于反射的方法可以使代码更简洁并且程序工作得更好。第二种方法是通过一个编程接口...

首页 / 更多教程 / JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例

JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例

内容导读

内容图文

内容总结

内容备注

内容手机端

【JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例】教程文章相关的互联网学习教程文章

JDBC的ResultSet游标转spark的DataFrame，数据类型的映射以TeraData数据库为例【代码】

sparkSQL中RDD——DataFrame——DataSet的区别

07 从RDD创建DataFrame【图】

DataFrame与数据库的相互转化

pandas中Series和Dataframe数据类型互转【代码】【图】

spark sql 之 RDD与DataFrame互相转化【代码】

新建一个空的DataFrame 表头与旧DataFrame 一致【代码】

成功解决ValueError: DataFrame.dtypes for data must be int, float or bool. Did not expect the data types

SparkRDD转DataSet/DataFrame的一个深坑【代码】

更多教程 - 最新教程

更多教程 - 最热教程