1.1 yarn 基本架構
1.2 yarn基本組成結構
(1)排程器
排程器根據容量、佇列等限制條件(如每個佇列分配一定的資源,最多執行一定數量的作業等),將系統中的資源分配給各個正在執行的應用程式。
(2)應用程式管理器
使用者提交的每個應用程式均包含1個am,主要功能包括:
與rm排程器協商以獲取資源(用container表示);
將得到的任務進一步分配給內部的任務;
與nm通訊以啟動/停止任務;
監控所有任務執行狀態,並在任務執行失敗時重新為任務申請資源以重啟任務。
3. nodemanager(nm)
nm是每個節點上的資源和任務管理器,一方面,它會定時地向rm匯報本節點上的資源使用情況和各個container的執行狀態;另一方面,它接收並處理來自am的container啟動/停止等各種請求。
4. container
container是yarn中的資源抽象,它封裝了某個節點上的多維度資源,如記憶體、cpu、磁碟、網路等,當am向rm申請資源時,rm為am返回的資源便是用container表示的。yarn會為每個任務分配乙個container,且該任務只能使用該container中描述的資源。
需要注意的是,container不同於mrv1中的slot,它是乙個動態資源劃分單位,是根據應用程式的需求動態生成的。截至本書完成時,yarn僅支援cpu和記憶體兩種資源,且使用了輕量級資源隔離機制cgroups進行資源隔離。
1.3 yarn工作流程
當使用者向yarn中提交乙個應用程式後,yarn將分兩個階段執行該應用程式:
如圖2-11所示,yarn的工作流程分為以下幾個步驟:
步驟6 nodemanager為任務設定好執行環境(包括環境變數、jar包、二進位制程式等)後,將任務啟動命令寫到乙個指令碼中,並通過執行該指令碼啟動任務。
1.4 多角度理解yarn
YARN架構及原理理解
hadoop yarn是乙個資源排程框架。yarn的基本思想是將資源管理和作業排程 監控的功能分解為單獨的守護程序。resourcemanager和nodemanager構成了資料計算框架。resourcemanager擁有系統中所有應用程式之間仲裁資源的最終許可權,也就是說,應用程式所需要的資源是...
Yarn的架構和原理
yarn的簡介 yarn是hadoop2引入的通用的資源管理和任務排程的平台,可以在yarn上執行mapreduce tez spark等多種計算框架,只要計算框架實現了yarn所定義的介面,都可以執行在這套通用的hadoop資源管理和任務排程平台上。產生背景 hadoop1.0是由hdfs和map...
hadoop中yarn的原理及執行
一 對yarn的理解 1.關於yarn的組成 大約分成主要的四個。2.resourcemanager rm 的理解 rm是全域性資源管理器,負責整個系統的資源管理和分配。主要由兩個元件組成 排程器和應用程式管理器 asm 應用程式管理器 負責管理整個系統中所有應用程式 使用者提交的每個應用程式均包含...