uber模式:允許小作業按序列在單個jvm中執行。
mapreduce.job.ubertask.enable=false;
mapreduce.job.ubertask.maxmaps=9;
mapreduce.job.ubertask.maxreduces=1;
mapreduce.job.ubertask.maxbytes="";
在mapred-site.xml中去新增配置(同步傳送並重啟):
>
>
mapreduce.job.ubertask.enablename
>
>
truevalue
>
property
>
>
>
mapreduce.job.ubertask.maxmapsname
>
>
9value
>
property
>
>
>
mapreduce.job.ubertask.maxreducesname
>
>
1value
>
property
>
>
>
mapreduce.job.ubertask.maxbytesname
>
>
value
>
property
>
聚合日誌:蒐集每乙個 container的log資訊(較為細粒度的日誌資訊),並可以移動到hdfs等檔案系統中。適合用於追蹤每個container的情況。
yarn.log-aggregation-enable=false;
yarn.log-aggregation.retain-seconds=""
配置:>
>
yarn.log-aggregation-enablename
>
>
truevalue
>
property
>
>
>
yarn.log-aggregation.retain-secondsname
>
>
86400value
>
property
>
>
>
yarn.log-aggregation.retain-check-interval-secondsname
>
>
3600value
>
property
>
>
>
yarn.nodemanager.log.retain-secondsname
>
>
10800value
>
property
>
>
>
>
>
/yarn/logsvalue
>
property
>
MapReduce鏈結作業
對於簡單的分析程式,我們只需乙個mapreduce就能搞定,然而對於比較複雜的分析程式,我們可能需要多個job或者多個map或者reduce進行計算。下面我們來說說多個job或者多個mapreduce的程式設計形式 mapreduce的主要有以下幾種程式設計形式 1 迭代式mapreduce map...
Mapreduce作業的處理流程
按照時間順序包括 輸入分片 input split map階段 combiner階段 shuffle階段和 reduce階段 輸入分片 input split 在進行map計算之前,mapreduce會根據輸入檔案計算輸入分片 input split 每個輸入分片 input split 針對乙個m...
Mapreduce作業的處理流程
mapreduce作業的處理流程。1.輸入分片 input split 在進行map計算之前,mapreduce會根據輸入檔案計算輸入分片 input split 每個輸入分片 input split 針對乙個map任務 輸入分片 input split 儲存的並非資料本身,而是乙個分片長度和乙個記...