spark sql基本內(nèi)容

IT那活兒發(fā)布于2023-01-11 13:20 / 2289人閱讀

spark sql基本內(nèi)容

點擊上方“IT那活兒”，關(guān)注后了解更多內(nèi)容，不管IT什么活兒，干就完了?。。?/span>

01

簡介

Spark SQL是spark中處理結(jié)構(gòu)化數(shù)據(jù)的模塊，區(qū)別于RDD接口，Spark SQL接口提供了更多關(guān)于數(shù)據(jù)結(jié)構(gòu)和執(zhí)行計算的信息，Spark SQL使用這些額外的信息進行額外的優(yōu)化，Spark SQL有兩種交互方式，SQL和DataSet API方式，但是這兩種方式使用的相同的執(zhí)行引擎。

Spark SQL可以從Hive中讀取數(shù)據(jù)，也可以通過編程語言與Spark SQL交互，這將返回DataSet/DataFrame數(shù)據(jù)集，也可以通過命令行或JDBC/ODBC與Spark SQL進行交互。

DataSet是分布式數(shù)據(jù)集，是Spark 1.6版本新增接口，其支持java、scala語言。DataFrame相當于關(guān)系型數(shù)據(jù)庫的表，其支持的數(shù)據(jù)源有結(jié)構(gòu)化文件、配置單元中的表、外部數(shù)據(jù)庫或RDD，其支持java、scala、python和R語言。

02

使用步驟

Spark功能入口是sparkSession，創(chuàng)建sparkSession：

03

支持的數(shù)據(jù)源

3.1 文件

3.2 hive表

spark支持對hive的讀寫，但是需要增加hive依賴，自spark2.0.0版本以后，可以使用spark.sql.warehouse.dir來配置默認數(shù)據(jù)倉庫的位置。

方法如下：

3.3 關(guān)系型數(shù)據(jù)庫

spark也可以方便的與關(guān)系型數(shù)據(jù)庫進行集成，可以對關(guān)系型數(shù)據(jù)庫進行讀寫，由于關(guān)系型數(shù)據(jù)庫都是結(jié)構(gòu)化數(shù)據(jù)庫，使用spark sql也可方便的進行分析。

下面以mysql為例進行說明：

1）首先需要添加驅(qū)動依賴：

2）讀取數(shù)據(jù)

3）寫入數(shù)據(jù)

創(chuàng)建user實體

04

總結(jié)

Spark SQL可以很方便的讀取結(jié)構(gòu)化數(shù)據(jù)，不僅支持文件的讀寫操作，還支持數(shù)據(jù)庫的讀寫，而且還支持多種語言，例如常用的java、scala、python、R語言，在實際工作中我們可以使用Spark SQL對結(jié)構(gòu)化數(shù)據(jù)進行清洗裝載等工作。

end

本文作者：潘宗昊

本文來源：IT那活兒（上海新炬王翦團隊）

云服務(wù)器 GPU云服務(wù)器大數(shù)據(jù)基本內(nèi)容 spark sql 大數(shù)據(jù)的基本內(nèi)容人工智能的基本內(nèi)容

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/129643.html

發(fā)表評論

登陸后可評論

0條評論

IT那活兒

男|高級講師

我要關(guān)注我要私信

TA的文章

消息中間件故障分析一例

閱讀 1356·2023-01-11 13:20
RAC雙節(jié)點crash回復一例

閱讀 1707·2023-01-11 13:20
ORA-600處理一例

閱讀 1215·2023-01-11 13:20
雙節(jié)點RAC實例2 HANG 故障分析一例

閱讀 1906·2023-01-11 13:20
RAC集群節(jié)點1重啟分析一例

閱讀 4165·2023-01-11 13:20
CRS啟動報錯CRS-1656處理分享

閱讀 2757·2023-01-11 13:20
oracle 12CR2打補丁報錯處理一例

閱讀 1402·2023-01-11 13:20
分布式緩存組件故障分析及監(jiān)控優(yōu)化

閱讀 3671·2023-01-11 13:20

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

spark sql基本內(nèi)容

點擊上方“IT那活兒”，關(guān)注后了解更多內(nèi)容，不管IT什么活兒，干就完了?。。?/span>

01

02