it 腦裂讓我們聊聊腦裂這事情

萬事皆有因

最近im雲平台也好，社交應用也好，大量的使用ejabberd的廠商湧現出來了。不過所有使用ejabberd廠商可能都會遇到mnesia腦裂的問題。在這裡打算簡單的談談腦裂這個事情。

什麼是腦裂

我在這裡面給個非官方的定義吧。當乙個集群的不同部分在同一時間都認為自己是活動的時候，我們就可以將這個現象稱為腦裂症狀。我們當如何理解這句話呢？

首先我們需要是個集群。

其次當中有業務是master－backup模式或雙星模式。也就是說當主節點掛掉了，備用節點需要接管業務或者是兩個節點直接有資料同步。

其中ejabberd front是不存在router的，只有client manager。而ejabberd back是具有message router 的。那麼我們可以將這個圖簡單的抽象為這樣的：

usera和userb分別將自己的資訊註冊在routera和routerb中。routera和routerb使用資料同步(2pc)，來同步資訊。那麼當usera想要向userb傳送乙個訊息的時候，需要現在routera中查詢出usera到userb的訊息路由路徑，然後再交付給相應的路徑進行路由。

當腦裂發生的時候，相當routera和routerb直接的聯絡丟失了，routera認為整個系統中只有它乙個router，routerb也是這樣認為的。那麼相當於routera中沒有userb的資訊，routerb中沒有usera的資訊了，此時usera再傳送訊息給userb的時候，routera會認為userb已經離線了，然後將該資訊進行離線持久化。

說到這裡面估計大家已經明白了腦裂是什麼東西了。

怎麼解決

paxos演算法，使用奇數性質的節點來進行表決，必須選出乙個說的算的老大，這個集群才能正常工作。

雙星模式下，使用專線直連，從硬體上保障。

使用額外的探測節點，當雙方直連斷開之後，使用乙個約定好的共同節點來探測是否是直連故障。

it 腦裂讓我們聊聊腦裂這事情

聊聊腦裂問題（split brain）

mysql腦裂如何防止HA集群的腦裂

drbd腦裂處理

it 腦裂 讓我們聊聊腦裂這事情

聊聊腦裂問題（split brain）

mysql腦裂 如何防止HA集群的腦裂

drbd腦裂處理

相關推薦

it 腦裂讓我們聊聊腦裂這事情

mysql腦裂如何防止HA集群的腦裂