hadoop2體系結構

hadoop1的核心組成是兩部分，即hdfs和mapreduce。在hadoop2中變為hdfs和yarn。

新的hdfs中的namenode不再是只有乙個了，可以有多個（目前只支援2個）。每乙個都有相同的職能。

這兩個namenode的地位如何哪？答：乙個是active狀態的，乙個是standby狀態的。當集群執行時，只有active狀態的namenode是正常工作的，standby狀態的namenode是處於待命狀態的，時刻同步active狀態namenode的資料。一旦active狀態的namenode不能工作，通過手工或者自動切換，standby狀態的namenode就可以轉變為active狀態的，就可以繼續工作了。這就是高可靠。

當namenode發生故障時，他們的資料如何保持一致哪？在這裡，2個namenode的資料其實是實時共享的。新hdfs採用了一種共享機制，journalnode集群或者nfs進行共享。nfs是作業系統層面的，journalnode是hadoop層面的，我們這裡使用journalnode集群進行資料共享。

如何實現namenode的自動切換哪？這就需要使用zookeeper集群進行選擇了。hdfs集群中的兩個namenode都在zookeeper中註冊，當active狀態的namenode出故障時，zookeeper能檢測到這種情況，它就會自動把standby狀態的namenode切換為active狀態。

hdfs federation（hdfs聯盟）是怎麼回事？答：聯盟的出現是有原因的。我們知道namenode是核心節點，維護著整個hdfs中的元資料資訊，那麼其容量是有限的，受制於伺服器的記憶體空間。當namenode伺服器的記憶體裝不下資料後，那麼hdfs集群就裝不下資料了，壽命也就到頭了。因此其擴充套件性是受限的。hdfs聯盟指的是有多個hdfs集群同時工作，那麼其容量理論上就不受限了，誇張點說就是無限擴充套件。

hadoop2體系結構

hadoop相關 HBase體系結構

oracle體系結構（2）

mysql 體系結構了解MySQL體系結構

hadoop2體系結構

hadoop相關 HBase體系結構

oracle體系結構（2）

mysql 體系結構 了解MySQL體系結構

相關推薦

mysql 體系結構了解MySQL體系結構