HDFS知識總結

2021-10-01 05:10:27 字數 826 閱讀 1791

① 自動檢測處理硬體錯誤;

② 流式訪問資料;

③ 轉移計算比移動資料更划算;

④ 簡單一致性模型;

⑤ 異構平台的可移植性。

hdfs的檔案被分成塊進行儲存;

hdfs塊預設大小64mb;

塊是檔案儲存處理的邏輯單元;

namenode: 執行在所有的master上,用來存放元資料,如檔名儲存 、塊的數量、副本的數量、位置塊、塊 id 等,為了使用的可持續性,本地磁碟中還存放元資料副本,這種元資料放在記憶體中可更快速地檢索資料,所以namenode機器應該配置較高的記憶體。

檔案與資料塊的對映表;

資料塊與資料節點的對映表。

datanode :是hdfs的工作節點,執行在所有的datanode上,這些是儲存資料的實際工作節點,存放資料塊。

檢視hdfs系統版本

hdfs version
檢視hdfs系統狀態

hdfs dfsadmin -report
檢視目錄及檔案

hadoop fs -ls /
建立及刪除目錄

hadoop fs -mkdir /input

hadoop fs -rm /input

hadoop fs -put 《本地檔案》 《遠端目錄》

hadoop fs -get 《遠端檔案》

檢視檔案內容

hadoop fs -cat /input/test.txt

HDFS知識總結

hdfs由namenode datanode senconarynamenode client組成 作用 namenode 是乙個主管,管理者 1 管理hdfs的命名空間 2 配置副本策略 3 管理資料塊 block 對映資訊 4 處理客戶端讀寫請求。datanode 1 儲存實際的資料塊 2 執行...

HDFS篇 HDFS相關概念總結

簡介 儲存模型為 位元組,以檔案切割成塊,單一檔案大小一致,檔案與檔案間可以不一致。其可以設定副本數,副本數不可超過節點數量。只支援一次寫入多次讀取,可追加資料。架構模型 namenode節點儲存檔案的元資料 單節點 datanode節點儲存檔案block資料 多節點 datanode與nameno...

HDFS知識點 四 HDFS元資料管理

元資料就是 hdfs的目錄結構以及每個檔案的block資訊 id 副本係數 block存放在哪個datanode上 對應配置 name 在 name current下,這些就是元資料 元資料存放在檔案中 一般情況下合併不會交給namenode來操作的,因為客戶端的所有請求都在namenode上,如果...