Spark Yarn開啟日誌聚集服務

2021-09-28 07:26:48 字數 2546 閱讀 9054

hadoop 預設是不啟用日誌聚集的。 在 yarn-site.xml 檔案裡配置啟用日誌聚集。

mapreduce.jobhistory.address

192.168.1.105:10020

192.168.1.105:19888

yarn.log-aggregation-enable

true

yarn.log-aggregation.retain-seconds

106800

yarn.log-aggregation-enable : 是否啟用日誌聚集功能。

yarn.log-aggregation.retain-seconds : 設定日誌保留時間, 單位是秒。

配置 spark-defaults.conf

spark.eventlog.enabled             true

spark.eventlog.dir file:///home/spark-2.1.1-bin-hadoop2.6.0/history_log

spark.history.update.interval 1

spark.history.ui.port 18080

然後啟動

sbin/start-history-server.sh /home/spark-2.1.1-bin-hadoop2.7/history_log
[hadoop@bigdata hadoop-2.6.0]$ sbin/stop-yarn.sh

[hadoop@bigdata hadoop-2.6.0]$ sbin/start-yarn.sh

hadoop配置啟動historyserver

/usr/local/hadoop-2.6.0目錄下執行如下命令

[hadoop@bigdata hadoop-2.6.0]$ sbin/mr-jobhistory-daemon.sh stop historyserver

[hadoop@bigdata hadoop-2.6.0]$ sbin/mr-jobhistory-daemon.sh start historyserver

(1) 執行乙個 demo mapreduce, 使之產生日誌

bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount /input /output1
(2) 檢視日誌

執行 job 後, 就可以在歷史伺服器 web 頁面檢視各個 map 和 reduce 的日誌了。

日誌也可以通過spark web ui來檢視executor的輸出日誌

但是此時需要啟動history server,需要讓spark history server和mapreduce history server執行著

並且在yarn-site.xml檔案中,配置yarn.log.server.url屬性

spark history server web ui中的log url,會將你重定向到mapreduce history server上,去檢視日誌

引數配置yarn-site.xml

1. yarn.log-aggregation-enable

引數說明:是否啟用日誌聚合功能,日誌聚合開啟後儲存到hdfs上。

預設值:false

2. yarn.log-aggregation.retain-seconds

引數說明:聚合後的日誌在hdfs上儲存多長時間,單位為s。

預設值:-1(不啟用日誌聚合),例如設定為86400,24小時

3. yarn.log-aggregation.retain-check-interval-seconds

引數說明:刪除任務在hdfs上執行的間隔,執行時候將滿足條件的日誌刪除(超過引數2設定的時間的日誌),如果是0或者負數,則為引數2設定值的1/10,上例值在此處為8640s。

預設值:-1

4. yarn.nodemanager.log.retain-seconds

引數說明:當不啟用日誌聚合此引數生效,日誌檔案儲存在本地的時間,單位為s

預設值:10800

引數說明:當應用程式執行結束後,日誌被轉移到的hdfs目錄(啟用日誌聚集功能時有效),修改為儲存的日誌資料夾。

預設值:/tmp/logs

引數說明:遠端日誌目錄子目錄名稱(啟用日誌聚集功能時有效)。

預設值:logs 日誌將被轉移到目錄yar

n.no

dema

nage

r.re

mote

−app

−log

−dir

/ya

rn.n

odem

anag

er.r

emot

e−ap

p−lo

g−di

r//$下

配置日誌聚集

所謂日誌聚集,就是指應用執行完以後,將程式的執行日誌資訊上傳到hdfs系統上。日誌聚集可以方便的檢視程式的執行詳情,方便開發除錯。開啟日誌聚集,需要重啟nodemanager resourcemanager和historymanager。1.配置yarn site.xml檔案 yarn.log ag...

yarn 日誌聚集配置

日誌聚集是yarn提供的日誌 化管理功能,它能將執行完成的container 任務日誌上傳到hdfs上,從而減輕nodemanager負載,且提供乙個 化儲存和分析機制。預設情況下,container 任務日誌存在在各個nodemanager上,如果啟用日誌聚集功能需要額外的配置。1 yarn.lo...

YARN的日誌聚集配置使用

說明 修改路徑 hadoop etc hadoop下的yarn site.xml。新增兩個屬性並儲存上傳伺服器。屬性1 表示在yanr上開啟聚合日誌服務。屬性2 表示聚合日誌在伺服器上的存留時間。sbin yarn daemon.sh start resourcemanager sbin yarn ...