備份專題 備份軟體方案可靠性解析

2021-12-29 21:14:28 字數 2952 閱讀 5380

備份軟體方案可靠性解析

ict架構師技術交流

分析和交流ict行業最前沿技術,分享更多儲存、伺服器、資料中心、網路、軟體定義和虛擬化等相關知識,旨在知識交流、開放共享和共同進步。

備份軟體是為了增強企業關鍵資料可靠性和資料冗餘性,那麼備份軟體自身的可靠性和可用性也直接影響著企業資料的可靠性。今天我們來**下備份軟體的的系統可靠性和可用性。

備份介質可靠性

針對備份介質,一般備份介質都提供了路徑冗餘(san儲存採用多路徑)、卷映象、快照和遠端複製等技術,可以保證儲存介質系統可靠性。但是對於備份介質來說,本身儲存的資料就是冗餘資料,在磁碟故障的情況,只需要保證有可用副本恢復以備份的資料就可以,採用遠端複製等技術一般用在整個儲存介質故障的場景,另外需要額外儲存空間和容量,對客戶而言成本過高。

備份介質(nas或san裝置)可以被多個ma備份介質使用,提供了資源利用率,然而,備份介質無法避免物理故障或硬體導致的錯誤,網路和儲存裝置都會出錯,當儲存介質裝置發生錯誤,在沒有進一步對備份資料進行保護時,就會導致了資料丟失。simpana在提供了gridstor技術加強備份介質冗餘可靠性。

介質伺服器可靠性

針對介質伺服器,simpana在介質伺服器層提供了gridstor技術,支援ma集群內的故障切換(failover)和負載均衡功能(load balancing),增加了資料訪問的高可用性。

當集群內ma故障或儲存介質發生故障,備份業務將會切換到可用的ma和備份介質上,並且gridstor還支援跨越作業系統的環境和儲存型別切換,如對windows檔案系統的備份作業,能從windows的ma切換到linux的ma上,使用者並不需要知道資料到底在哪個裝置上,資料在恢復時,系統會自動給找到需要恢復的資料。

另外,ma的並行並行去重能實現負載均衡和故障切換,確保效能的同時,增加了系統的高可用性。目前支援把2臺ma組合起來進行去重,具體工作流程如下:

首先客戶端選擇ma(datamover)傳送資料到ma上生產指紋,並使用內部演算法來選擇哪個分割槽來執行指紋查詢。如果所選的分割槽在另乙個ma上,就通過網路在對應ma上進行查詢。

如果查詢發現資料已經存在,就只需要在所選擇的分割槽中更新引用,在ma訪問的裝載路徑上更新元資料指標,如果查詢發現是新資料,就需要在所選擇的分割槽中插入指紋,並通過客戶端所選的ma備份資料到對應的儲存介質中。但整個過程,在保證ma可靠性的同時,也做到ma間還是共享重刪指紋庫。

備份管理伺服器可靠性

在整個備份軟體系統中,備份管理伺服器commserve是simpana平台中最核心的伺服器,commserve中含有重要的配置資訊、安全設定、使用者資訊、許可證以及tier1層索引,一旦這些重要的資料丟失,重建系統相當困難。

冷備份方案

針對備份管理伺服器comm serve,simpana自身也支援commserve dr選項,當主commserve故障時,可以通過commserve dr伺服器來啟動備份任務管理,但是dr伺服器是一種冷備份方式,資料不會自動同步,需要手動把對commserve的備份資料恢復到dr commserve伺服器中。

首先在主備站點各部署一台commserve (ip位址和機器名保持一致),通常情況下,備站點commserve是關機狀態。備站點提供乙個檔案共享空間,主站點的commserve的catalog庫定期備份到備站點的檔案共享空間中。

當主站點commserve異常時,啟動備站點的commserve伺服器。選擇最近的乙個catalog備份集,在備份站點的commserve伺服器上匯入catalog備份集,匯入完成後,備站點對外提供被任務管理服務。

高可用方案

commserve dr方案是乙個冷備份方案,恢復操作漫長,而且整個恢復過程都需要人為干預。為了提供simpana自動化和高可靠能力,commserve也具備安裝在集群環境中的能力,如:微軟mscs集群上。mscs集群在widows 2012中就支援,而且在simpana備份軟體中就自帶sql server資料庫儲存索引和指紋資料。

針對commserve集群mscs/ msfc部署,commserve資料庫(索引和指紋資料)的部署方式也分為2種方式:雙陣列雙活部署和單陣列部署。基於雙陣列的集群部署,採用陣列的雙活特性,在陣列層實時同步建立在san陣列雙活卷之上commserve資料資料(圖中master server實際上就是commserve伺服器)。

基於單陣列部署方式,基於集群mscs/msfc軟體特性保證資料互斥訪問、資料一致性,在san陣列上建立卷分別對映給主備commserve伺服器,主站點commserve伺服器故障,業務將通過集群切換到備站點commserve上執行。

雙陣列雙活部署可以防止commserve伺服器和commserve資料庫(san陣列)故障,單陣列部署只能防止commserve伺服器故障。在集群環境中,如果主備commserve伺服器要要跨站點部署,commserved上的ms sql集群日誌檔案對時延是有要求的(資料來自sql server 2008微軟官網)。

按照微軟官方推薦,如果要效能最優,日誌檔案時間要<1ms,這個要求在跨站點部署的情況下不可能達到,一般在實踐應用中選用<5ms,採用裸光纖san網路鏈路,當光纖距30公理,要加dwdm波分裝置。

軟體可靠性

1983年美國ieee計算機學會對 軟體可靠性 作出了明確定義,此後該定義被美國標準化研究所接受為國家標準,1989年我國也接受該定義為國家標準。該定義包括兩方面的含義 1 在規定的條件下,在規定的時間內,軟體不引起系統失效的概率 2 在規定的時間週期內,在所述條件下程式執行所要求的功能的能力 其中...

軟體可靠性測試

軟體可靠性測試的目的 軟體可靠性測試的主要目的有 1 通過在有使用代表性的環境中執行軟體,以證實軟體需求是否正確實現。2 為進行軟體可靠性估計採集準確的資料。估計軟體可靠性一般可分為四個步驟,即數 據採集 模型選擇 模型擬合以及軟體可靠性評估。可以認為,資料採集是整個軟體可靠性 估計工作的基礎,資料...

如何提高軟體可靠性

一 軟體可靠性定義 長期執行的穩定性 魯棒性 輸出資料的正確性 異常情況的可記錄性 二 影響軟體可靠性的因素 1 需求分析定義錯誤 由於分析失誤,從開始就走上了錯誤的路線,向著錯誤的目標前進,以後實現中的錯誤在所難免。2 設計質量 設計水平的高低與設計者的水平有著直接的聯絡,但可以通過人文方法提高設...