1)namenode:它是乙個主管,管理者
1. 管理hdfs的命名空間
2. 配置副本策略
3. 管理資料塊block對映資訊
4. 處理客戶端讀寫請求
2)datanode:執行實際的操作,執行者
1. 儲存實際的資料塊
2. 執行資料塊的讀/寫操作
3)client:客戶端
1. 檔案切分,檔案上傳hdfs時,client將檔案切分成乙個乙個的block,然後進行上傳
2. 與namenode互動,獲取檔案的位置資訊
3. 與datanode互動,讀取或者寫入資料
4. client提供一些命令來管理hdfs,比如namenode格式化
5. client可以通過一些命令來訪問hdfs,比如對hdfs增刪查改操作
4)secondary namenode:不是namenode的熱備,它不能在namenode掛掉時替換namenode並提供服務
1. 輔助namenode,分擔其工作量,比如定期合併fsimage和edits,並推送給namenode
2. 在緊急情況下,可輔助恢復namenode
HDFS架構概述 二
因為在複習的時候發現有很多的東西時沒有寫到部落格當中的,所以在這裡就補充一下希望大家多提出一些意見,謝謝大家 hdfs的侷限性 1 低延時資料訪問,在使用者互動性的應用中,應用需要在ms或者幾個s的時間內得到回應。由於hdfs未高吞吐率做了設計,也因此犧牲了快速響應,對於低延時的用用,可以考慮使用h...
HDFS概述及HDFS優缺點
隨著資料量越來越大,在乙個作業系統上儲存不了所有的資料,那麼就分配到更多的作業系統管理的磁碟中,但是不方便管理和維護,迫切需要一種系統來管理多台機器上的檔案,這就是分布式檔案管理系統。hdfs只是分布式檔案管理系統的一種 hdfs hadoop distributed file system 它是乙...
HDFS架構簡述
hdfs架構簡述 一 hdfs簡介 hdfs hadoop distributed file system hadoop分布式檔案系統。是基於流資料模式訪問和處理超大檔案的需要而開發的,可以執行於廉價的伺服器上。它所具有的高容錯,高可靠性,高可擴充套件性,高獲得性,高吞吐率等特徵為海量資料提供了不怕...