集群環境: chd5-2.5.2
我們集群使用的是failscheduler,如果佇列引數設定不合理,會直接影響到任務執行的快慢。
佇列設定不合理
現狀:該隊裡minshare設定的過小,同時起的任務太多
導致的問題:該佇列中平均每個任務分的資源比較少,任務跑的特別慢,同時,任務之間會相互搶占container
比如下面的任務,跑了30多個小時,還沒跑完
看一下任務詳情:
1,當前只分配了11個container,還差約4000個cotnainer才能完成任務,
2,container被kill掉了約16000個,資源浪費嚴重
container 被kill掉的原因,大部分是因為container被別的任務搶占。:
解決辦法:
yarn資源管理
在tarn中,資源管理由rescouecemanager和nodemanager共同完成,其中,resourcemanager中的排程器負責資源分配,而nodemanager則負責資源的供給和隔離。resourcemanager將某個nodemanager上資源分配給任務 這就是所謂的資源排程 後,...
Yarn的資源管理
假設一台機器有48g物理記憶體 8core 按照1 2的一般配置 虛擬core vcore 有 16個 1 linux系統本身要佔記憶體 空留 20 48 0.2 9.6g 剩餘 80 38.4g 2 dn程序 datanode 生產4g 更改datanode的配置 hadoop env.sh ha...
YARN資源管理和排程簡介
1 執行在yarn上的mapreduce應用程式 2 執行在yarn上的storm應用程式 3 yarn應用程式基本構成 客戶端 4 以mapreduce應用程式為例 mapreduce客戶端 將mapreduce作業提交到yarn上 查詢mapreduce作業執行狀態 管理mapreduce作業,...