MapReduce On YARN的工作原理

2021-08-02 07:57:35 字數 426 閱讀 3808

mapreduce計算框架

將計算過程分為兩個階段:map和reduce

map階段並行處理輸入資料;

reduce階段對map結果進行彙總

shuffle連線map和reduce兩個階段

map task將資料寫到本地磁碟;

reduce task從每個map task上讀取乙份資料;

僅適合離線批處理

具有較好的容錯性和擴充套件性;

適合批處理任務;

缺點:啟動map/reduce任務開銷大、過多使用磁碟導致io頻繁等;

mapreduce on yarn(mrv2)

mapreduce on yarn工作原理

6)nodemanager啟動任務;

mapreduce on yarn的工作流程

當client提交乙個任務後,首先resourcemanger rm 來排程出乙個container,這個container是在nodemanger nm 運作的,am會計算此次任務所需的資源,然後向rm申請資源,得到一組供map reduce task執行的container,然後協同nm一起對每...

MapReduce On Yarn的執行流程

yarn是乙個資源排程平台,負責為運算程式提供伺服器運算資源,相當於乙個分布式的作業系統平台,而mapreduce等運算程式則相當於執行於作業系統之上的應用程式。yarn的架構如下圖所示 總的來說,rm有以下功能 1 處理客戶端的請求 3 監控nodemanager 4 資源分配與排程 1 負責資料...

uWSGI django nginx的工作原理流程

wsgi 一種實現python解析的通用介面標準 協議,是一種通用的介面標準或者介面協議,實現了python web程式與伺服器之間互動的通用性。利用它,web.py或bottle或者django等等的python web開發框架,就可以輕鬆地部署在不同的web server上了 uwsgi 同ws...