spark優化引數調整思路

spark引數調整

1. 減少num-executors，調大executor-memory，這樣的目的是希望executor有足夠的記憶體可以使用 2. cache的級別適當調成memory_only_ser和disk_only 3. 修改邏輯，避免shuffle；shuffle是stage的區分標準 4. 引數設定 spark.sql .shuffle .partitions spark.serializer

5.設定廣播變數

2. spark 提高並行度

實現簡單，可在需要shuffle的操作運算元上直接設定並行度或者使用spark.default.parallelism設定。如果是spark sql，還可通過set spark.sql.shuffle.partitions=[num_tasks]設定並行度。可用最小的代價解決問題。一般如果出現資料傾斜，都可以通過這種方法先試驗幾次，如果問題未解決，再嘗試其它方法。

spark優化引數調整思路

spark之shuffle引數優化

linux 核心引數調整優化網路

mysql 優化調整mysql 併發相關引數

spark優化引數調整思路

spark之shuffle引數優化

linux 核心引數調整優化網路

mysql 優化 調整mysql 併發相關引數

相關推薦

mysql 優化調整mysql 併發相關引數