hadoop2體系結構

2021-06-28 16:37:54 字數 944 閱讀 9097

hadoop1的核心組成是兩部分,即hdfs和mapreduce。在hadoop2中變為hdfs和yarn。

新的hdfs中的namenode不再是只有乙個了,可以有多個(目前只支援2個)。每乙個都有相同的職能。

這兩個namenode的地位如何哪?答:乙個是active狀態的,乙個是standby狀態的。當集群執行時,只有active狀態的namenode是正常工作的,standby狀態的namenode是處於待命狀態的,時刻同步active狀態namenode的資料。一旦active狀態的namenode不能工作,通過手工或者自動切換,standby狀態的namenode就可以轉變為active狀態的,就可以繼續工作了。這就是高可靠。

當namenode發生故障時,他們的資料如何保持一致哪?在這裡,2個namenode的資料其實是實時共享的。新hdfs採用了一種共享機制,journalnode集群或者nfs進行共享。nfs是作業系統層面的,journalnode是hadoop層面的,我們這裡使用journalnode集群進行資料共享。

如何實現namenode的自動切換哪?這就需要使用zookeeper集群進行選擇了。hdfs集群中的兩個namenode都在zookeeper中註冊,當active狀態的namenode出故障時,zookeeper能檢測到這種情況,它就會自動把standby狀態的namenode切換為active狀態。

hdfs federation(hdfs聯盟)是怎麼回事?答:聯盟的出現是有原因的。我們知道namenode是核心節點,維護著整個hdfs中的元資料資訊,那麼其容量是有限的,受制於伺服器的記憶體空間。當namenode伺服器的記憶體裝不下資料後,那麼hdfs集群就裝不下資料了,壽命也就到頭了。因此其擴充套件性是受限的。hdfs聯盟指的是有多個hdfs集群同時工作,那麼其容量理論上就不受限了,誇張點說就是無限擴充套件。

hadoop相關 HBase體系結構

hbase的體系結構遵從主從伺服器架構 主 hbase master 從 hregion server群 hbase中所有的伺服器都是通過zookeeper來協調 並處理執行期間可能出現的錯誤。一 邏輯模型 以nutch 2.0下hbase存放資料的表 webpage 為例 describe 由表的...

oracle體系結構(2)

1.shared pool 共享池 share pool 是由library cache和data dictionary cache 構成 共享池是對sql,pl sql程式語法分析,編譯執行的記憶體區域。seared pool 的作用 1.用於儲存 最近執行的sql語句 最近使用的資料定義 2.它...

mysql 體系結構 了解MySQL體系結構

mysql 資料庫體系結構圖 mysql 由以下幾部分組成 1 connectors 不同語言中與 sql 的互動 show variables like connection variable name value character set connection utf8 collation c...