應用程式可以知道是否以及如何壓縮中間輸出,可以通過configuration配置來指定使用哪種compressioncodecs(壓縮演算法)。
其中,setup()是在乙個task執行之前需要完成的準備工作;map() 是對分片中的每乙個k-v對進行處理;cleanup()是在task執行完成後進行一些收尾工作。run方法則提供了前面三個方法執行的模板。protected void setup(context context
) throws ioexception, interruptedexception
protected void map(keyin key, valuein value,
context context) throws ioexception, interruptedexception
protected void cleanup(context context
) throws ioexception, interruptedexception
public void run(context context) throws ioexception, interruptedexception
} finally
}
參考:
MapReduce程式設計模型
計算採用一組輸入鍵 值對,並產生一組輸出鍵 值對。mapreduce庫的使用者將計算表達為兩個函式 map和reduce。input1 map a,1 b,1 c,1 input2 map b,1 input3 map a,1 c,1 reduce c,2 reduce b,2 reduce a,2...
MapReduce 程式設計模型
mapreduce 簡介 mapreduce 本身是一種支援並行運算的程式設計模型 思想 這個程式設計模型分為兩個階段 map 階段和 reduce 階段。hadoop 的 mapreduce 框架 hadoop 的 mapreduce 是實現 mapreduce 程式設計模型的乙個分布式計算框架,...
MapReduce 程式設計模型
mapreduce 是一種簡化平行計算的程式設計模型,用於大資料量的計算。它的核心思想是 分散任務,彙總結果 將大規模資料集的操作分發給乙個主節點管理下的各個子節點共同完成,然後整合各個子節點的中間結果,從而得到最終結果。mapreduce的優點 1 便於程式設計 mapreduce 只需簡單地實現...