大資料篇 Spark安裝及測試PI的值

關於hadoop的安裝，這裡就不概述了！

spark部署模式主要有四種：local模式（單機模式）、standalone模式（使用spark自帶的簡單集群管理器）、yarn模式（使用yarn作為集群管理器）和mesos模式（使用mesos作為集群管理器）。

這裡介紹local模式（單機模式）的 spark安裝。

運用winscp將spark-1.6.3-bin-hadoop2.6.tgz上傳到master伺服器主節點端的/usr/local下，解壓

sudo tar -zxf spark-1.6.3-bin-hadoop2.6.tgz cd /usr/local sudo chown -r hadoop:hadoop ./spark #此處的hadoop為你的使用者名稱

安裝後，還需要修改spark的配置檔案spark-env.sh

cd /usr/local/spark-1.6.3-bin-hadoop2.6 cp ./conf/spark-env.sh.template ./conf/spark-env.sh

編輯spark-env.sh檔案(vim ./conf/spark-env.sh)，在第一行新增以下配置資訊:

export spark_dist_classpath=$(/usr/local/hadoop-2.8.4/bin/hadoop classpath)

有了上面的配置資訊以後，spark就可以把資料儲存到hadoop分布式檔案系統hdfs中，也可以從hdfs中讀取資料。如果沒有配置上面資訊，spark就只能讀寫本地資料，無法讀寫hdfs資料。配置完成後就可以直接使用，不需要像hadoop執行啟動命令。通過執行spark自帶的示例，驗證spark是否安裝成功。

cd /usr/local/spark-1.6.3-bin-hadoop2.6 bin/run-example sparkpi

執行時會輸出非常多的執行資訊，輸出結果不容易找到，可以通過 grep 命令進行過濾（命令中的 2>&1 可以將所有的資訊都輸出到 stdout 中，否則由於輸出日誌的性質，還是會輸出到螢幕中）

bin/run-example sparkpi 2>&1 | grep "pi is"

過濾後的執行結果如下圖示，可以得到π 的近似值：

大資料篇 Spark安裝及測試PI的值

大資料面試 Spark篇（二）

大資料技術與應用實驗七報告 Spark安裝配置

大資料之sqoop sqoop的安裝及常用操作

大資料篇 Spark安裝及測試PI的值

大資料面試 Spark篇（二）

大資料技術與應用 實驗七報告 Spark安裝配置

大資料之sqoop sqoop的安裝及常用操作

相關推薦

大資料技術與應用實驗七報告 Spark安裝配置