Yarn的架構及原理基礎

2021-07-24 02:03:14 字數 1363 閱讀 9644

1.1 yarn 基本架構

1.2 yarn基本組成結構

(1)排程器

排程器根據容量、佇列等限制條件(如每個佇列分配一定的資源,最多執行一定數量的作業等),將系統中的資源分配給各個正在執行的應用程式。

(2)應用程式管理器

使用者提交的每個應用程式均包含1個am,主要功能包括:

與rm排程器協商以獲取資源(用container表示);

將得到的任務進一步分配給內部的任務;

與nm通訊以啟動/停止任務;

監控所有任務執行狀態,並在任務執行失敗時重新為任務申請資源以重啟任務。

3. nodemanager(nm)

nm是每個節點上的資源和任務管理器,一方面,它會定時地向rm匯報本節點上的資源使用情況和各個container的執行狀態;另一方面,它接收並處理來自am的container啟動/停止等各種請求

4. container

container是yarn中的資源抽象,它封裝了某個節點上的多維度資源,如記憶體、cpu、磁碟、網路等,當am向rm申請資源時,rm為am返回的資源便是用container表示的。yarn會為每個任務分配乙個container,且該任務只能使用該container中描述的資源。

需要注意的是,container不同於mrv1中的slot,它是乙個動態資源劃分單位,是根據應用程式的需求動態生成的。截至本書完成時,yarn僅支援cpu和記憶體兩種資源,且使用了輕量級資源隔離機制cgroups進行資源隔離。

1.3  yarn工作流程

當使用者向yarn中提交乙個應用程式後,yarn將分兩個階段執行該應用程式:

如圖2-11所示,yarn的工作流程分為以下幾個步驟:

步驟6 nodemanager為任務設定好執行環境(包括環境變數、jar包、二進位制程式等)後,將任務啟動命令寫到乙個指令碼中,並通過執行該指令碼啟動任務。

1.4 多角度理解yarn

YARN架構及原理理解

hadoop yarn是乙個資源排程框架。yarn的基本思想是將資源管理和作業排程 監控的功能分解為單獨的守護程序。resourcemanager和nodemanager構成了資料計算框架。resourcemanager擁有系統中所有應用程式之間仲裁資源的最終許可權,也就是說,應用程式所需要的資源是...

Yarn的架構和原理

yarn的簡介 yarn是hadoop2引入的通用的資源管理和任務排程的平台,可以在yarn上執行mapreduce tez spark等多種計算框架,只要計算框架實現了yarn所定義的介面,都可以執行在這套通用的hadoop資源管理和任務排程平台上。產生背景 hadoop1.0是由hdfs和map...

hadoop中yarn的原理及執行

一 對yarn的理解 1.關於yarn的組成 大約分成主要的四個。2.resourcemanager rm 的理解 rm是全域性資源管理器,負責整個系統的資源管理和分配。主要由兩個元件組成 排程器和應用程式管理器 asm 應用程式管理器 負責管理整個系統中所有應用程式 使用者提交的每個應用程式均包含...