hadoop版本3.1.2。
在搭建完hadoop高可用集群後,一般會驗證一下namenode在發生故障時,能否自動切換。
在停掉其中一台namenode服務後,發現剩下的namenode不能自動切換,就是說檢視它們的狀態還是standby。
我遇到的原因有兩個:
沒有安裝psmisc,導致找不到 fuser命令。
各個namenode所在機器之間要能夠互相免密登入,包括自己。
這時候要看日誌,在其中一台namenode伺服器去檢視zkfc日誌。以我的為例,zkfc日誌顯示錯誤如下:
可以看到是找不到 fuser命令,就是我機器沒有安裝 psmisc。
yum install -y psmisc
至於另外一種情況的zkfc日誌錯誤顯示如下:
我的是三颱namenode,三颱機之間已經能夠互相免密登入,就是沒有做登入本機自己也要能夠免密登入。所以才會報這個錯誤。
解決以上兩個問題後,再去檢視namenode的狀態,可以發現其中一台已經變成active。
Yarn實現的Hadoop集群高可用
本文緊接上篇部落格hadoop nfs zookeeper實現高可用集群 yarn是hadoop集群的資源管理系統。hadoop2.0對mapreduce框架做了徹底的設計重構,我們稱hadoop2.0中的mapreduce為mrv2或者yarn。hadoop2.x也就是yarn,分別用兩個程序來管...
0 3 Hadoop高可用集群搭建
準備三颱相互免秘鑰的虛擬機器 上傳zookeeper 解壓 移動 解壓zookeeper的tar包 語法 tar zxf zookeeper 3.4.6.tar.gz 移動zookper目錄 語法 mv zookeeper 3.4.6 opt sxt 修改配置檔案zoo.cfg進入zookeeper...
高可用集群
高可用集群主要實現自動偵測 auto detect 故障 自動切換 故障轉移 failover 和自動恢復 failback 簡單來說就是,用高可用集群軟體實現故障檢查和故障轉移 故障 備份主機切換 的自動化,當然像負載均衡 dns分發也可提供高可性。active passive 主備模型 acti...