基於Linux的集群系統(六)

2021-08-27 14:45:05 字數 1249 閱讀 2563

基於linux的集群系統(六)

關鍵技術分析之 高可用性

本篇是《關鍵技術分析》的第二篇,將為您講述集群系統高可用性,主要包括集群管理器和節點的高可用性。

計算機系統的可靠性用平均無故障時間(mttf)來度量,即計算機系統平均能夠正常執行多長時間,才發生一次故障。系統的可靠性越高,平均無故障時間越長。可維護性用平均維修時間(mttr)來度量,即系統發生故障後維修和重新恢復正常執行平均花費的時間。系統的可維護性越好,平均維修時間越短。計算機系統的可用性定義為:mttf/(mttf+mttr) * 100%。由此可見,計算機系統的可用性定義為系統保持正常執行時間的百分比。

計算機產業界通常用如下表所示的"9"的個數來劃分計算機系統可用性的型別。

:通過硬體冗餘或軟體的方法都可以從很大程度上提高系統的可用性。硬體冗餘主要是通過在系統中維護多個冗餘部件如硬碟、網線等來保證工作部件失效時可以繼續使用冗餘部件來提供服務;而軟體的方法是通過軟體對集群中的多台機器的執行狀態進行監測,在某台機器失效時啟動備用機器接管失效機器的工作來繼續提供服務。

一般來說,需要保證集群管理器的高可用性和節點的高可用性。eddie、linux virtual server、turbolinux、piranha和ultramonkey 都採用了類似於圖1的高可用性解決方案。

:集群管理器的高可用性

為了遮蔽集群管理器的失效,需要為它建立乙個備份機。主管理器和備份管理器上都執行著heartbeat程式,通過傳送諸如"我活著"這樣的資訊來監測對方的執行狀況。當備份機不能在一定的時間內收到這樣的資訊時,它就啟用fake程式,讓備份管理器接管主管理器繼續提供服務;當備份管理器又從主管理器收到"我活著"這樣的資訊時,它就使fake程式無效,從而釋放ip位址,這樣主管理器就開始再次進行集群管理的工作了。

節點的高可用性

節點的高可用性可以通過不斷監視節點的狀態以及節點上的應用程式的執行狀態來實現,當發現節點已經失效時,可以重新配置系統並且將工作負載交給那些執行正常的節點來完成。如圖1所示,系統通過在集群管理器上執行mon精靈程式來監視集群中的實際伺服器上的服務程式的執行狀況。例如使用fping.monitor 以一定的時間間隔來監視實際伺服器是否還在正常運轉;使用http.monitor 來監測http服務,使用ftp.monitor來監測ftp服務等等。如果發現某個實際伺服器出了故障,或者是其上的服務已失敗,則在集群管理器中刪除有關這個實際伺服器的所有規則。反之,如果不久以後發現系統已經重新能夠提供服務,則增加相應的所有規則。通過這種方法,集群管理器可以自動遮蔽伺服器和其上執行的服務程式的失效,並且當實際伺服器正常運轉時能將它們重新加入到集群系統中。

基於linux的集群系統(一)

目錄基於linux的集群系統 一 基於linux的集群系統 二 基於linux的集群系統 三 基於linux的集群系統 四 基於linux的集群系統 五 基於linux的集群系統 六 基於linux的集群系統 七 基於linux的集群系統 八 基於linux的集群系統 九 第一台計算機問世已經半個世...

搭建集群系統LVS

lvs系統採用了 ip負載均衡技術,並且由 ipvs 模組來實現。ipvs 模組是lvs 系統的核心軟體,它被安裝在排程伺服器上。排程伺服器上需要設定乙個虛擬 ip vip 然後客戶端向這個 vip傳送請求訪問,之後 ipvs 模組從眾多應用伺服器中選取乙個服務節點來響應使用者請求 所以一定要把 伺...

LVS 伺服器集群系統

lvs linux virtual server,負載排程器,核心整合,章文嵩 花名 正明 阿里的四層slb server load balance 是基於lvs keepalived實現 lvs 官網 vs virtual server 負責排程 rs real server lvs 負責真正提供...