隨著社會發展和科技進步, 資料中心面臨的風險和威脅越來越大,一旦資料中心因為突發災難造成關鍵業務資料丟失或資訊系統故障,將嚴重影響企業業務的正常運營,甚至威脅到**** 。而包含有大量電子裝置的資料中心各系統在執行過程中不可避免地都會發生因故障而失效的時候。硬體故障、軟體錯誤、人工操作失誤甚至對系統的惡意破壞,這些都可能導致系統執行的非正常中斷,影響系統中資料的正確性或破壞系統的資料庫,使部分甚至全部資料丟失。所以如何保證資料中心的業務連續運營是資料中心管理者們首先要考慮的重要問題。
資料中心保持業務連續最大的威脅不是來自於火災、**等小概率、大影響的災難, 更多地受到諸如人為錯誤、流程缺陷等事件的威脅。這些威脅時刻潛伏在企業的周圍, 隨時一觸即發,會影響資料中心的業務連續性, 使企業造成重大損失。
今年以來,資料中心故障引發的業務故障觸目驚心:
2023年1月31日,亞馬遜amazon.com主頁出故障,一小時的中斷時間讓該公司錯失了近500萬美元的收入;2023年1月28日,facebook**業務中斷;
2023年2月1-2,微軟的office 365編輯套件和outlook.com郵件服務陸續出現了業務中斷;
2023年6月3日,twitter服務業務中斷,twitter使用者無法訪問該服務來傳送或讀取內容;
這些大型的網際網路資料中心都會頻繁出現業務中斷的故障,其它的資料中心就更是故障不斷了。當然這些企業也知道業務持續中斷意味著什麼,可有時卻又在資料中心故障面前顯得無能為力。
表1列出了各個行業資料中心中斷乙個小時造成的損失預估,可見損失是要按分鐘來計算的,資料中心無法提供服務就意味著業務的減少,時間和金錢都將受損,業務連續性對資料中心來說重要性不言而喻。在當今資訊高速發展的社會,人們的工作、生活高度依賴於各類資訊的傳遞與管理。而這些資訊處理的背後都有資料中心在高效運轉,很難想象如果沒有資料中心這個世界怎能運轉。人們越是依賴於資料中心,資料中心對人們就越重要。而提供穩定、持續的服務,這是人們對資料中心的基本要求。現實中這種要求卻很難做到,這是因為資料中心是乙個資訊科技高度集中的場所,技術實現複雜,備份技術很多但要做到全部備份成本就太高,並且過度的備份也增加了系統執行的複雜性,反而帶來了整體執行的不穩定。
表1:資料中心業務中斷造成的損失預估表
那麼如何才能有效保證資料中心的業務連續性?
要保持資料中心業務的長期連續性困難重重,因為保持資料中心業務連續是乙個長期、全面、持續完善的過程。在完成資料中心建設之後,還應考慮如何確定業務需求和進行應急響應等問題,為保證資料中心業務連續性,需要從組織和團隊、it技術、基礎設施、業務恢復到公共關係管理等各個方面做工作。這些工作涉還可能涉及機構高管層、科技、財務、審計等各個部門,因此為保障資料中心業務的連續性需要全員參與,是乙個複雜的即涉及技術又涵蓋管理的綜合問題。
關於如何保持業務的連續性問題已經引起了各類專家的熱議,對於資料中心更是需要保持業務的連續性。業務連續性管理已經演變成了一門管理學科,在資料中心中得到了越來越多的應用。所謂業務連續性管理,即business continuity management,簡稱bcm.這個概念最早脫胎於傳統的it備份與容災恢復計畫,業務連續性管理是乙個一體化的管理過程,通過這一過程,可以識別威脅組織機構的潛在風險,並提供乙個指導性框架來建立組織機構的恢復能力和有效應急響應能力,從而保護利益相關者的資產,組織機構的信譽、品牌及其創造價值的活動。bcm的前身是災難恢復(dr)和業務連續計畫(bcp),真正受到重視是在20世紀90年代,尤其是2023年美國911恐怖事件之後,開始了快速發展。作為乙個相對較新的概念,業務連續性管理相關工作在中國剛剛起步,在2023年sars期間得到重視,並在2023年汶川**時災後出列方面取得了成就。目前,bcm已經在越來越多的企業中得到普及,尤其是資料中心領域。大約有85%的全球性企業實施了災難恢復(dr)計畫,但是僅有15%具備了完善的業務連續性計畫(bcm),即僅有少數企業的災難恢復計畫是以保障業務連續性為目標。如果沒有乙個完善並具可操作的連續性計畫,是無法確保達到災備恢復預期目標的。
bcm主要用於解決資料中心業務連續性兩個方面的問題:
(1) 高可用性
是指提供在資料中心部分故障的情況下,仍能提供繼續訪問應用的能力。不論這個故障是業務流程、物理設施、it軟/硬體的故障。
(2) 災難恢復
是指當災難破壞資料中心時在不同地點、不同硬體裝置上恢復資料的能力。上述兩個方面不是相互孤立的,而是相互關聯、有交叉的。為保證資料中心的業務連續性,高可用性和災難恢復要對映到資料中心的各個層面,從使用者終端到伺服器、 儲存器、甚至包括機房環境。國際標準iso20000和iso27001建立了規範的it服務和資訊保安的管理體系,在iso20000的框架內,就包含了可持續性管理流程的內容。
持續性管理具有以下活動和過程:風險和災難規避評估、確定整體恢復策略、確定與建設業務持續性計畫、設計開發持續性和災備預案、預案演練、預案維護。通過這些活動可以將資料中心業務中斷的風險有效降低。
資料中心的管理者已經意識到了資料中心業務連續性的重要性,關鍵是要採取有效的bcm管理,確保資料中心不再發生業務中斷。
UPS系統對資料中心的重要性
對於資料中心來說,在電力系統的執行過程中,不可避免地會出現故障。儘管故障出現的機率很小,持續的時間也不長,但產生的後果卻往往十分嚴重。電力系統發生故障時,執行狀態將經歷急劇變化。所以ups系統的應用對於機房電力系統不間斷執行來說尤為重要。對ups系統日常檢測 維護也更是重中之重。ups檢測與維護 機...
論安全的重要性
論安全的重要性 安全 是乙個永不過時的話題。在我們的現實生活中,無數的事實告訴我們,凡是無視安全的行為必將付出慘痛的代價。世界上每天都在發生著安全事故,汽車超載,超速行駛,闖紅燈 生產單位偷工減料,違規操作 公共服務場所無視安全規範 種種無視安全的情況造成了一起又一起的安全事故。慘痛的教訓告訴我們任...
論溝通的重要性
溝通,是建立人際關係的橋梁,如果這個世界缺少了溝通,那將是乙個不可想象的世界。可以這樣說,沒有溝通就沒有人際的互動關係,人與人之間關係,就會處在僵硬 隔閡 冷漠的狀態,會出現誤解 扭曲的局面,給工作和生活帶來極大的害處。資訊時代的到來,工作 生活節奏越來越快,人與人之間的思想需要加強交流 社會分工越...