mapreduce計算框架
將計算過程分為兩個階段:map和reduce
map階段並行處理輸入資料;
reduce階段對map結果進行彙總
shuffle連線map和reduce兩個階段
map task將資料寫到本地磁碟;
reduce task從每個map task上讀取乙份資料;
僅適合離線批處理
具有較好的容錯性和擴充套件性;
適合批處理任務;
缺點:啟動map/reduce任務開銷大、過多使用磁碟導致io頻繁等;
mapreduce on yarn(mrv2)
mapreduce on yarn工作原理
6)nodemanager啟動任務;
mapreduce on yarn的工作流程
當client提交乙個任務後,首先resourcemanger rm 來排程出乙個container,這個container是在nodemanger nm 運作的,am會計算此次任務所需的資源,然後向rm申請資源,得到一組供map reduce task執行的container,然後協同nm一起對每...
MapReduce On Yarn的執行流程
yarn是乙個資源排程平台,負責為運算程式提供伺服器運算資源,相當於乙個分布式的作業系統平台,而mapreduce等運算程式則相當於執行於作業系統之上的應用程式。yarn的架構如下圖所示 總的來說,rm有以下功能 1 處理客戶端的請求 3 監控nodemanager 4 資源分配與排程 1 負責資料...
uWSGI django nginx的工作原理流程
wsgi 一種實現python解析的通用介面標準 協議,是一種通用的介面標準或者介面協議,實現了python web程式與伺服器之間互動的通用性。利用它,web.py或bottle或者django等等的python web開發框架,就可以輕鬆地部署在不同的web server上了 uwsgi 同ws...