《詳解資料中心災備切換技術》
目錄
1、網路切換技術
(1)基於ip位址的切換
(2)基於dns伺服器的切換
(3)基於負載均衡裝置的切換
2、應用切換技術
(1)主備集群 (cluster)遠端技術
(2)雙活負載均衡技術
資料中心災備切換是一系列操作的組合,無論是生產中心還是災備中心,彼此的業務之間都有邏輯的聯絡,服務的啟動順序也有嚴格的要求。
故障的型別多種多樣,災備中心每一次的啟用,都需要耗費大量的人力和物力,所以不是每一種災難都需要啟用災備中心。在發生災難時,首先需要快速判斷災難的型別、可恢復性和後果,然後根據災備預案來決定是否啟用災備中心。
比如,通過本地備份只需要半小時就能恢復本地的業務,就完全不需要啟用災備中心。此外,應用級災備的物件往往是關鍵的業務,越關鍵的業務,切換就越需要慎重,因此啟動切換決策需要集體的決策,而不是根據單一的個人意願。
主備應用伺服器的ip位址空間同,客戶端通過唯一的ip位址訪問應用伺服器。在正常情況下,只有生產中心應用伺服器的ip位址處於可用狀態,災備中心的備用伺服器ip位址處於禁用狀態。災難一旦發生,管理員手動或通過指令碼將災備中心伺服器的ip位址設定為可用,實現網路訪問路徑切換。
dns網域名稱解析是b/s應用架構的一項重要服務,c/s架構應用一般是通過ip位址直接訪問服務的。在雲計算時代,業務主要通過b/s、分布式、多活的架構提供。然而對於**運營和服務提供商來說,dns網域名稱解析的穩定可靠,意味著更好的業務體驗,更好更大的訪問流量。
dns伺服器的切換模式下,所有應用都需要根據主機名來訪問,而不是直接根據主機的ip位址來訪問,從而通過網域名稱實現網路切換。組織對外提供服務的業務,可通過向運營商申請應的dns伺服器,對主生產中心和備用生產中心各申請應的dns服務,通過運營商dns切換機制實現對外服務的切換。
對於內部提供的業務,生產中心和災備中心各自部署一台dns伺服器,負責所有主機的網域名稱解析。生產中心為主dns伺服器,災備中心為備份dns伺服器,兩台dns伺服器的內容自動保持完全同步。
dns是網際網路上作為網域名稱和ip位址相互對映的乙個分布式資料庫。dns能夠使使用者更方便的訪問網路和應用,而不用去記憶雜亂、繁瑣的ip數串。通過網域名稱,最終得到該網域名稱對應的ip位址的過程叫做網域名稱解析。下面這張圖,詳細說明了乙個dns網域名稱解析的全過程。
實際上,網際網路上的dns伺服器也是按照層次安排的。每乙個網域名稱伺服器只對網域名稱體系中的一部分進行管轄。根據網域名稱伺服器所起的作用,可以把網域名稱伺服器劃分為根網域名稱伺服器、頂級網域名稱伺服器、許可權網域名稱伺服器和本地網域名稱伺服器四種不同的型別。
根網域名稱伺服器是最高層次的網域名稱伺服器,也是最重要的網域名稱伺服器。所有的根網域名稱伺服器都知道所有的頂級網域名稱伺服器的網域名稱和ip位址。不管是哪乙個本地網域名稱伺服器,若要對網際網路上任何乙個網域名稱進行解析,只要自己無法解析,就首先求助根網域名稱伺服器。所以根網域名稱伺服器是最重要的網域名稱伺服器。假定所有的根網域名稱伺服器都癱瘓了,那麼整個dns系統就無法工作。
我們在配置dns解析的時候,需要指定dns解析的ttl(time to live)引數,這個引數告訴本地dns伺服器,網域名稱快取的最長時間。用阿里雲解析來舉例,阿里雲解析預設的ttl是10分鐘,10分鐘的含義是本地dns伺服器對於網域名稱的快取時間是10分鐘,10分鐘之後,本地dns伺服器就會刪除這條記錄,刪除之後,如果有使用者訪問這個網域名稱,就要重複一遍上述複雜的流程。
如果**已經進入穩定發展的狀態,不會輕易更換ip位址,我們完全可以將ttl設定到協議最大值,即24小時。帶來的好處是,讓網域名稱解析記錄能夠更長時間的存放在本地dns伺服器中,以加快所有使用者的訪問。
分布式、多活資料中心對外提供資料服務時,還會涉及到另外乙個引數rtt(round trip time)。分布在物理上a、b隔離兩個區域的資料中心同時對外提供服務時,客戶的服務請求是由a資料中心,還是由b資料中心響應,這就要看在dns解析過程中,決定於解析過程中那個訪問帶來的rtt更小。下面一起通過乙個例項來分析下技術原理。
分布式、多活資料中心中,乙個網域名稱對應兩個業務ip位址,分別部署在兩個資料中心。通過gslb或dns實現站點間的訪問負載均衡。
gslb可以採用專用的f5 gtm裝置,如果業務量小,也可以採用windows自帶的dns伺服器,實現簡單負載均衡(輪詢),gslb跨站點負載均衡策略通常有兩種。
gslb在整個網路範圍內將使用者的請求定向到最近的節點(或者區域),主要採用就近性判斷,主要的方法包括dns、應用層重定向、傳輸層重定向等。然而,slb大多在乙個服務節點範圍內,根據裝置節點的健康性、當前負載、服務能力、分布等情況將使用者的請求分配到乙個具體服務節點裝置。
負載均衡(loadbalance)是一種伺服器或網路裝置的集群技術。負載均衡將特定的業務(網路服務、網路流量等)分擔給多個伺服器或網路裝置,從而提高了業務處理能力,保證了業務的高可用性。負載均衡基本概念有:實服務、實服務組、虛服務、排程演算法、持續性等,其常用應用場景主要是伺服器負載均衡,鏈路負載均衡。
負載均衡用來在多個計算機(計算機集群)、網路連線、cpu、磁碟驅動器或其它資源中分配負載,以達到最佳化資源使用、最大化吞吐率、最小化響應時間、同時避免過載的目的。那麼,這種計算機技術的實現方式有多種。大致可以分為以下幾種,其中最常用的是四層和七層負載均衡:
應用切換是指生產中心由於發生災難無法作業時,可由災備中心的備用伺服器提供業務接管,確保業務不停。實現應用切換的前提條件是:資料已經從生產中心同步到災備中心,如果資料複製採用的是非同步的方式,在網路故障的情況下,就有可能造成資料不一致的問題,導致資料不可用或無法訪問。
災備中心配置與生產中心對應的應用軟體伺服器、資料庫伺服器和中介軟體伺服器等,且執行正常。應用切換技術主要有以下幾種:
集群遠端是指通過在生產中心和災備中心的應用伺服器上安裝遠端集群軟體,實現跨廣域的多伺服器狀態的監控,當發生災難時,實現應用伺服器的自動切換。
集群遠端容災技術為集群的共享資料及業務提供了一種更為可靠的遠端保護手段,通過該方案,可以將本地集群中的共享資料通過網路備份到遠端災備伺服器上,實現集群資料的異地災備,在資料備份的基礎之上還可以在本地集群不可用時,通過選擇自動或手動將本地業務切換至遠端災備中心伺服器,從而減少業務的停機時間。
主備集群應用切換方式的弊端在於,多種潛在因素如集群伺服器心跳線中斷、網路短時間中斷、應用伺服器響應不及時等,容易導致在生產中心實際執行正常情況下進行誤切換,執行風險高。
歸類到應用切換功能,雙活技術是一種利用it資源較多的災備方案,**於多中心技術。
真正意義的雙活指兩個資料中心同時處於生產狀態,類似於負載均衡技術,但通常的負載均衡針對業務流量而非資料保護和資料安全,啟用所有資源共同承載業務的服務,同時保證當其中一邊發生故障時,另一邊的資源可直接接管所有的業務服務。
雙活可以保證資源的充分利用和快速的災備切換,是快速安全的應用級災備策略,主要用於同城災備系統。異地雙活系統則由於需要考慮系統的合理拆分、資料複製和業務服務的協調、災備接管策略等,因此也被稱為最為複雜的災備技術架構。隨著雲計算和分布式系統的發展,資料災備切換在多資料中心、分布式應用架構和應用中越來越重要。
詳解 資料中心網路三大新技術
近幾年,資料中心網路技術得到了迅速發展,各種新技術不斷湧現,資料中心裡最後的一塊封鎖基地也終於得以開墾。任何技術的進步都不是一撮而就的,需要經過各種磨練,還會有不同的聲音,也會有不少的技術會不斷消失,本文就來具體說一說資料中心網路湧現了哪些新技術。大二層技術 大二層技術是目前最火的網路技術,獲得了資...
做好災備,為你的資料中心留條後路
很多企業都在考慮乙個問題,就是如何建立乙個靈活的 有彈性的資料中心。這其中包括確保計算機系統和其他重要裝置的有序恢復,保證所有供電系統的正常運轉等等。為實現這一目標,我們需要乙個完善的災難恢復規劃。假設你希望資料中心的恢復規劃良好,你必須將資料中心看做業務流程,其中有大量相互依賴且變化的部分。並且,...
資料中心技術
現代資料中心是指一種特殊的it基礎設施,用於集中放置it資源,包括伺服器 資料庫 網路與通訊裝置以及軟體系統,接下來介紹資料中心常見組成技術與部件 1 虛擬化 資料中心包含了物理和虛擬的it資源。物理it資源層是指放置計算 網路系統和裝置,以及硬體系統及其作業系統的基礎設施。虛擬層對資源進行抽象和控...