① 自動檢測處理硬體錯誤;
② 流式訪問資料;
③ 轉移計算比移動資料更划算;
④ 簡單一致性模型;
⑤ 異構平台的可移植性。
hdfs的檔案被分成塊進行儲存;
hdfs塊預設大小64mb;
塊是檔案儲存處理的邏輯單元;
namenode: 執行在所有的master上,用來存放元資料,如檔名儲存 、塊的數量、副本的數量、位置塊、塊 id 等,為了使用的可持續性,本地磁碟中還存放元資料副本,這種元資料放在記憶體中可更快速地檢索資料,所以namenode機器應該配置較高的記憶體。
檔案與資料塊的對映表;
資料塊與資料節點的對映表。
datanode :是hdfs的工作節點,執行在所有的datanode上,這些是儲存資料的實際工作節點,存放資料塊。
檢視hdfs系統版本
hdfs version
檢視hdfs系統狀態
hdfs dfsadmin -report
檢視目錄及檔案
hadoop fs -ls /
建立及刪除目錄
hadoop fs -mkdir /input
hadoop fs -rm /input
hadoop fs -put 《本地檔案》 《遠端目錄》
hadoop fs -get 《遠端檔案》
檢視檔案內容
hadoop fs -cat /input/test.txt
HDFS知識總結
hdfs由namenode datanode senconarynamenode client組成 作用 namenode 是乙個主管,管理者 1 管理hdfs的命名空間 2 配置副本策略 3 管理資料塊 block 對映資訊 4 處理客戶端讀寫請求。datanode 1 儲存實際的資料塊 2 執行...
HDFS篇 HDFS相關概念總結
簡介 儲存模型為 位元組,以檔案切割成塊,單一檔案大小一致,檔案與檔案間可以不一致。其可以設定副本數,副本數不可超過節點數量。只支援一次寫入多次讀取,可追加資料。架構模型 namenode節點儲存檔案的元資料 單節點 datanode節點儲存檔案block資料 多節點 datanode與nameno...
HDFS知識點 四 HDFS元資料管理
元資料就是 hdfs的目錄結構以及每個檔案的block資訊 id 副本係數 block存放在哪個datanode上 對應配置 name 在 name current下,這些就是元資料 元資料存放在檔案中 一般情況下合併不會交給namenode來操作的,因為客戶端的所有請求都在namenode上,如果...