對mapReduce效能調優的總結

2021-08-28 19:07:22 字數 901 閱讀 2482

mapreduce效能調優的著手點有如下幾個

1、map輸出的壓縮

2、reducetask數量的設定

3、shuffle資料處理過程中的一些引數

分別如下:

一、map的輸出壓縮

設定方法有兩種

1、通過configuration.set(name,value)設定

2、通過配置檔案mapred-site.xml設定

重要引數如下:

name1:mapreduce.map.output.compress  ,  value1:true

name2:mapreduce.map.output.compress.codec  ,  value2:(可選)

二、通過設定reduce task number

此方法測試時類似正態分佈,通過測試不斷縮小範圍,找到對稱軸,找到最優的task數量

三、shuffle過程的引數

如:(給個思路,具體引數自己上官網查)

1、map在環形快取區的溢位記憶體預設值為100m,可以設定

mapreduce.task.io.sort.mb

2、溢位記憶體寫入磁碟的百分比預設是80%,可以設定

mapreduce.task.io.sort.spill.percent

3、在合併前,當數量達到多少時才對檔案進行合併,預設是10

mapreduce.task.sort.factor

4、執行map和reduce任務時核數設定

mapreduce.map.cpu.vcores

mapreduce.reduce.cpu.vcores

5、執行map和reduce任務時記憶體設定(少用)

mapreduce.map.memory.mb

mapreduce.map.memory.mb

MapReduce作業調優

1,map緩衝區記憶體改大 環形緩衝區越大,溢寫次數越少,磁碟 io 的次數越少,執行速度就越快 預設100m,可配置 2,map輸出壓縮 減少io 可配置 3,reduce拉取過來的資料直接存記憶體,避免落盤,這樣合併也能在記憶體中完成 可配置 4,shuffle中的多次磁碟io操作非常消耗效能,...

MapReduce的調優總結

mapreduce的調優總結 mapreduce 伺服器調優 1.mapreduce.task.io.sort.factor mr程式進行合併排序的時候,開啟的檔案數量,預設為10個.3.mapreduce.map.sort.spill.percent mr程式進行flush操作的閥值,預設0.80...

調優 Nginx效能調優

一.nginx優化配置 1.主配置檔案優化 注 部分配置詳解 worker processes 8 nginx程序數,建議按照cpu數目來指定,一般為它的倍數。worker cpu affinity 00000001 00000010 00000100 00001000 00010000 00100...