Hadoop學習日記(九) Yarn框架

2021-09-24 21:39:24 字數 534 閱讀 2869

2019.07.01

學習過程主要參考段海濤大資料p26

1. runjar程序向resourcemanager申請執行乙個job;

2. resourcemanager返回job相關資源的提交路徑staging-dir和為本job產生的jobid;

3. 向hdfs提交資源;

4. 匯報提交結果;

5. 將本job加入任務佇列;

6. 領取任務;

7. 分配執行資源容器;

9. 向resourcemanager註冊;

10. 啟動map任務程序;

11. 啟動reduce任務程序;

12. job完成後,向resourcemanager登出自己。

上述只是乙個大體的流程,具體實現時還有很多細節,例如某個map任務執行較慢,可在另一台機器上啟動乙個相同的map任務,當某個map率先結束時,相同的其他map就會終止執行。

Hadoop學習筆記 YARN

yarn產生背景 為什麼會產生yran?這個與mapreduce1.x的架構有關,正是因為mapreduce1.x存在許多的問題,才會產生 yarn。mapreduce1.x的架構如下 hadoop1.x時,mapreduce的架構仍然是主從架構。乙個jobtracker帶多個tasktracker...

Hadoop學習筆記之YARN

yarn service框架提供了一流的支援和api,可以在yarn中本地化時間執行的服務。簡而言之 in a nutshell 它作為乙個容器編排平台,用於管理yarn上的貨櫃化服務。它支援yarn中的docker容器和傳統的基於程序的容器。該框架的職責包括執行配置解決方案和安裝,生命週期管理 如...

Hadoop學習日記(一)

2019.02.27 1.客戶端上傳檔案時,nn首先往edits log檔案中記錄元資料操作日誌 2.客戶端開始上傳檔案,完成後返回成功資訊給nn,nn就在記憶體中寫入這次上傳操作的新產生的元資料資訊 3.每當edits log寫滿時,需要將這一段時間的新的元資料刷到fsimage檔案中去 將edi...