HDFS寫檔案的過程

1、副本及儲存策略：

2、寫檔案的網路流量及磁碟空間：

網路流量=磁碟空間=檔案size*dfs.replication

3、寫資料的流程

* client將檔案file1劃分出blocks —— block1、block2、block3... * client向nn發出寫block的請求 —— 檔案file1的block1 * nn響應client的請求 —— 指示client將file1的block1寫到如下位置： * rack1 上的 datanodea、datanodeb * rack2 上的 datanodec * client向datanodea發出寫block的請求： * 檔案file1的block1 * 並告知還需將block寫到datanodeb和datanodec * datanodea一邊將資料存入自身磁碟，一邊向datanodeb發出寫block的請求，具體內容同上一步驟 * datanodeb一邊將資料存入自身磁碟，一邊向datanodec發出寫block的請求，具體內容同上一步驟 * datanodec完成block資料儲存後，響應datanodeb： * 告知自身對file1-block1的儲存已經正常完成。 * 自身同時儲存元資料（file1,block1，block1start...） * datanodeb接收到datanodec的響應後，響應datanodea： * 告知對file1-block1的儲存已經正常完成。 * 自身同時儲存元資料（file1,block1,block1start..） * datanodea接收到datanodec的響應後，響應client。 * datanodea、datanodeb、datanodec在儲存乙個新的block後，會向nn傳送報告，nn會及時更新file1-block1的元資料： * （fiel1，block1，replicationids） * replicationid1，datanodea * replicationid2，datanodeb

* replicationid3，datanodec

HDFS寫檔案的過程

HDFS寫資料過程

HDFS寫檔案解析

HDFS寫檔案流程

HDFS寫檔案的過程

HDFS寫資料過程

HDFS寫檔案解析

HDFS寫檔案流程

相關推薦