大資料之Hadoop2 0框架之YARN

2021-10-14 04:20:41 字數 1339 閱讀 6275

3.yarn工作流程

4.yarn核心元件概念

5.容錯能力

定位:可以理解成分布式作業系統

作用:資源整合,讓系統資源得到最大化利用,同一套硬體集群中可以執行多個任務(mr,spark,flink…)

mapreduce經歷了完全重構,不再是hadoop的核心元件,

而成為yarn 上的一種應用框架

4.1 resoucemanager

rm是yarn的主,相當於hadoop1.0中jobtracker 進行權利的下放

4.2 nodemanager

負責jobtracker中「任務排程」的角色

本質: am是乙個 container,管理其他的container,是乙個任務的主,啟動任務的時候 am啟動, 當任務執行完畢,am消失。也是乙個普通的container

• 應用程式的master,每乙個應用對應乙個am,在使用者提交乙個應用程式時,乙個am的輕量型程序例項會啟動,am協調應用程式內的所有任務的執行

• 負責乙個job生命週期內的所有工作,類似舊的jobtracker

• 每乙個job都有乙個am,執行在rm以外的機器上

• 與rm協商資源

– 與scheduler協商合適的container

• 與nm協同工作與scheduler協商合適的container進行container的監控

• 是乙個普通container的身份執行

4.4 container

本質:是乙個程序,是由nm進行啟動,作用:真正執行任務的地方

•yarn 將cpu核數,記憶體這些計算資源都封裝成為乙個個的容器

•是任務執行環境的抽象封裝(8,16g)container(1cpu,2g)container(1cpu,6g)

• container只是使用nm上指定資源的權利

• am必須向nm提供更多的資訊來啟動container

• 描述任務的執行資源(記憶體、cpu)、啟動命令run.sh和執行環境

(1)rm掛掉怎麼辦? 主(對外服務)備(資料備份,準備隨時登位)切換

(2)nm掛掉怎麼辦?

nm有am:整個任務掛掉

nm沒有am:只是存在執行任務的container, 進行臨時調配,整個任務不會掛

(2)am掛掉怎麼辦?

rm上有乙個am,來負責啟動am

大資料之Hadoop框架(一)

三 hadoop應用 四 hadoop優勢及意義 quad quad apache hadoop 是乙個開源的,可靠的 reliable 可擴充套件的 scalable 用於大資料儲存 計算 分析的分布式儲存系統和分布式計算框架。quad quad hdfs hadoop distributed f...

大資料hadoop之yarn

yarn是乙個資源排程平台負責為運算程式提供伺服器運算資源,相當於乙個分布式作業系統平台,mr等程式在上面執行。mr程式把任務提交到客戶端所在節點 rm將使用者請求初始化乙個task進入自己的任務排程佇列,傳送task任務到nm am向rm申請執行maptask容器 rm向nm分配maptask,n...

大資料之 hadoop 簡介

簡介 hadoop 是乙個由 apache 會所開發的分布式系統基礎架構,它可以使使用者在不了解分布式底層細節的情況下開發分布式程式,充分利用集群的威力進行高速運算和儲存。從其定義就可以發現,它解決了兩大問題 大資料儲存 大資料分析。也就是 hadoop 的兩大核心 hdfs 和 mapreduce...