hadoop 三 hdfs 機架感知

2021-08-03 05:02:51 字數 539 閱讀 4851

client 向 active nn 傳送寫請求時,nn為這些資料分配dn位址,hdfs檔案塊副本的放置對於系統整體的可靠性和效能有關鍵性影響。乙個簡單但非優化的副本放置策略是,把副 本分別放在不同機架,甚至不同idc,這樣可以防止整個機架、甚至整個idc崩潰帶來的錯誤,但是這樣檔案寫必須在多個機架之間、甚至idc之間傳輸,增 加了副本寫的代價,是否有較優的方案來解決這個問題呢?

目錄:

常用策略:

第乙個副本放在和client相同機架的node裡(如果client不在集群範圍,第乙個node是隨機選取不太滿或者不太忙的node)

第二個副本放在與第乙個node不同的機架中的node

第三個副本放在與第二個node所在機架裡不同的node. 示例圖如下:

機架配置:

分配原理:

hdfs 機架感知

client 向 active nn 傳送寫請求時,nn為這些資料分配dn位址,hdfs檔案塊副本的放置對於系統整體的可靠性和效能有關鍵性影響。乙個簡單但非優化的副本放置策略是,把副本分別放在不同機架,甚至不同idc,這樣可以防止整個機架 甚至整個idc崩潰帶來的錯誤,但是這樣檔案寫必須在多個機架之...

HDFS 機架感知

實際上需要工程師收到建立乙個指令碼 python sh 指令碼中記錄主機ip和交換機的對應關係。配置的位置是core site.xml最終新增如下配置 usr bin python coding utf 8 import sys rack if name main print rack.get sy...

Hadoop 機架感知

hadoop中副本在不同節點之間的複製需要消耗資源,為了充分發揮hadoop的效能,hadoop需要配置機架感知,這可以讓hadoop通過網路拓撲圖計算不同節點之間的距離,因此來減少資料傳輸消耗的資源。通過hadoop官網我們知道,不配置機架感知,所有的都預設為 default rack,可以通過命...