MapReduce可調整引數解釋

2021-08-23 14:07:13 字數 1233 閱讀 9248

引數名稱

引數含義

預設值io.sort.mb

map task緩衝區所佔記憶體大小

100mb

io.sort.record.percent

緩衝kvoffsets和kvindices共佔io.sort.mb的記憶體比例

0.05

io.sort.spill.percent

緩衝區kvoffsets或者kvoffsets記憶體使用率達到該比例後,會觸發溢寫操作,將記憶體中的資料寫成乙個檔案

0.80

mapred.compress.map.output

是否壓縮map task中間結果

true

mapred.map.output.compression.codec

如果支援壓縮map task中間結果,則採用什麼壓縮器

org.apache.hadoop.io.compress.zlib

引數名稱

引數含義

預設值mapred.reduce.parallel.copies

reduce task同時啟動的資料拷貝執行緒數目

5mapred.job.reduce.input.buffer.percent

hadoop假設使用者的reduce()函式需要所有的jvm記憶體,因此執行reduce()函式前要釋放所有記憶體。如果設定了該值,可將部分檔案儲存在記憶體中(不必寫到磁碟上)

0mapred.job.shuffle.input.buffer.percent

shufflerammanager管理的記憶體佔jvm heap max size的比例

0.70

mapred.job.shuffle.merge.percent

當記憶體使用率超過該值後,會觸發一次合併,將記憶體中的資料寫到磁碟上

0.66

mapred.inmem.merge.threshold

當記憶體中的檔案數量超過該閾值時,會觸發一次合併,將記憶體中的資料寫到磁碟上

1000

io.sort.factor

檔案合併時,一次合併的檔案數目(合併後,將合併後的檔案放到磁碟上繼續合併,注意,每次合併時,選擇最小的前io.sort.factor進行合併)

10或100

http server上的執行緒數。該server執行在每個task tracker上,用於處理map task輸出

40

可呼叫物件

我們可以向演算法傳遞任何類別的可呼叫物件 函式,函式指標,過載了函式呼叫運算子的類,lambda 表示式,bind 函式。函式物件 1 如果類過載了函式呼叫運算子,則我們可以像使用函式一樣使用該類的物件。因為這樣的類同時也能儲存狀態,所以與普通函式相比他們更加靈活。例 struct absint i...

自製可調電源

在各種電子相關小製作,除錯中,電源供電是必備不可少的。市面上有巨多的電源,比如 但是,都有些許問題困擾。一是基於適用性和成本考慮,這裡講的適用性就是我們大多數使用時的電壓範圍,電流範圍。這裡我們用 來搜尋 電源模組 可調電源 銷量第一的是 就是這種12v輸出可調的電源模組,使用這種單獨的電源模組存在...

可呼叫物件

在python中可以用callable函式檢視乙個物件是不是可呼叫 1 deffn 2print ha ha ha 34callable fn 5 true 乙個類被例項化後,這個例項物件是乙個不可呼叫物件 1 class fun 2def init self,name 3 self.name na...