sparkSQL讀取資料的方法

2021-08-21 20:01:19 字數 819 閱讀 8486

本文中所有資料以本地資料為資料來源

1、讀取json檔案

2、讀取txt檔案

spark.read下除了json方法用於讀取json檔案外,還有讀取資料的而其他方式,使用testfile方法時一直不行,不清楚是對txt檔案的格式有要求還是後續的方法不對,有朋友知道的勞煩指點下

val testtxt = spark.read.textfile("c:/users/administrator/desktop/課程**/employee.txt")

testtxt.show() //成功讀取檔案資料

後來改用createdataframe方法,這種方法不像前面的那個,稍微麻煩點,textfile返回的是個rdd,通過createdataframe方法將rdd轉為dataframe進行查詢

Spark sql 自定義讀取資料源

通常在乙個流式計算的主流程裡,會用到很多對映資料,比較常見的是text文件,但是文件讀進來之後還要匹配相應的schema,本文通過自定義textsource資料來源,自動讀取預設的schema。defaultsource.scala package com.wxx.bigdata.sql custo...

使用sparksql讀取mysql中的資料

val sc new sparkcontext conf val sqlcontext new sqlcontext sc var jdbcdf sqlcontext.read.format jdbc options map url jdbc mysql driver com.mysql.jdbc....

SQLAlchemy 讀取資料的方法

把資料新增進資料庫後,sqlalchemy 可以通過model.query 方法對資料進行查詢。model.query 是 db.session.query modle 的簡寫。1.使用all 函式獲取資料庫中的所有行,並作為列表返回。users user.query.all users 2.使用l...