yarn概述?
yarn
是乙個資源排程平台,負責為運算程式提供伺服器運算資源,相當於乙個分布式的作業系統平台,而mapreduce
等運算程式則相當於執行於作業系統之上的應用程式
yarn的重要概念
1 )yarn
並不清楚使用者提交的程式的執行機制 2
)yarn
只提供運算資源的排程(使用者程式向yarn
申請資源,yarn
就負責分配資源) 3
)yarn
中的主管角色叫resourcemanager
4 )yarn
中具體提供運算資源的角色叫nodemanager
5 )這樣一來,yarn
其實就與執行的使用者程式完全解耦,就意味著yarn
上可以執行各種型別的分布式運算程式(mapreduce
只是其中的一種),比如mapreduce
、storm
程式,spark
程式…… 6
)所以,spark
、storm
等運算框架都可以整合在yarn
上執行,只要他們各自的框架中有符合yarn
規範的資源請求機制即可 7
)yarn
就成為乙個通用的資源排程平台,從此,企業中以前存在的各種運算集群都可以整合在乙個物理集群上,提高資源利用率,方便資料共享
yarn工作機制
2 )工作機制詳解
(0)mr
程式提交到客戶端所在的節點
(1)yarnrunner
向resourcemanager
。 (2 )rm
將該應用程式的資源路徑返回給yarnrunner (3
)該程式將執行所需資源提交到hdfs
上 (4
(5 )rm
將使用者的請求初始化成乙個task (6
)其中乙個nodemanager
領取到task
任務。(7
)該nodemanager
建立容器container (8
)container
從hdfs
上拷貝資源到本地
(9向rm
申請執行maptask
容器(10
)rm將執行maptask
任務分配給另外兩個nodemanager
,另兩個nodemanager
分別領取任務並建立容器。
(11)mr
向兩個接收到任務的nodemanager
傳送程式啟動指令碼,這兩個nodemanager
分別啟動maptask
,maptask
對資料分割槽排序。
(12向rm
申請2個容器,執行reduce task
。 (13
)reduce task
向maptask
獲取相應分割槽的資料。
(14)程式執行完畢後,mr
會向rm
登出自己。
Yarn工作機制
yarn是乙個資源排程平台,負責為運算程式提供伺服器運算資源,相當於乙個分布式的作業系統平台,而mapreduce等運算程式則相當於執行於作業系統之上的應用程式1 yarn 並不清楚使用者提交的程式的執行機制 2 yarn 只提供運算資源的排程 使用者程式向 yarn 申請資源,yarn 就負責分配...
Yarn的工作機制原理
2 工作機制詳解 0 mr程式提交到客戶端所在的節點。2 rm將該應用程式的資源路徑返回給yarnrunner。3 該程式將執行所需資源提交到hdfs上。5 rm將使用者的請求初始化成乙個task。6 其中乙個nodemanager領取到task任務。8 container從hdfs上拷貝資源到本地...
YARN 高可用機制
yarn 的高可用 resourcemanager 基於zookeeper 實現高可用機制,避免單點故障。作為通用的 統一的資源管理系統,yarn可以 1 同時首席執行官應用程式 比如service,http server 2 執行短應用程式 mapreduce job spark job 等等 在...