在資料中心生命週期中,資料中心運維管理是資料中心生命週期中最後乙個、也是歷時最長的乙個階段。資料中心運維管理就是:為提供符合要求的資訊系統服務,而對與該資訊系統服務有關的資料中心各項管理物件進行系統的計畫、組織、協調與控制,是資訊系統服務有關各項管理工作的總稱。資料中心運維管理主要肩負起以下重要目標:合規性、可用性、經濟性、服務性等四大目標。
由於雲計算
的要求彈性、靈活快速擴充套件、降低運維成本、自動化資源監控、多租戶環境等特性除基於itil的常規資料中心運維管理理念之外,以下運維管理方面的內容,也需要我們加以重點分析和關注。
一、理清雲計算資料中心的運維物件
資料中心的運維管理指的是與資料中心資訊服務相關的管理工作的總稱。雲計算資料中心運維物件共可分成5類:
(1) 機房環境基礎設施部分。這裡主要指為保障資料中心所管理裝置正常執行所必需的網路通訊、電力資源、環境資源等。這部分裝置對於使用者來說幾乎是透明的,因為大多數使用者基本並不會關注到資料中心的風火水電。但是,這類裝置如發生意外,對依託於該基礎設施的應用來說,卻是致命的。
(2) 在提供it服務過程中所應用的各種裝置,包括儲存、伺服器、網路裝置、安全裝置等硬體資源。這類裝置在向使用者提供it服務過程中提供了計算、儲存與通訊等功能,是it服務最直接的物理載體。
(3) 系統與資料,包括作業系統、資料庫、中介軟體、應用程式等軟體資源;還有業務資料、配置檔案、日誌等各類資料。這類管理物件雖然不像前兩類管理物件那樣「看得見,摸得著」,但卻是it服務的邏輯載體。
(4) 管理工具,包括了基礎設施監控軟體、監控軟體、工作流管理
平台、報表平台、簡訊平台等。這類管理物件是幫助管理主體更高效地管理資料中心內各種管理物件,並在管理活動中承擔起部分管理功能的軟硬體設施。通過這些工具,可以直觀感受並考證到資料中心如何管理好與其直接相關的資源,從而間接地提公升的可用性與可靠性。
(5) 人員,包括了資料中心的技術人員、運維人員、管理人員以及提供服務的廠商人員。人員一方面作為管理的主體負責管理資料中心運維物件,另一方面也作為管理的物件,支援it的執行。這類物件與其他運維物件不同,具有很強的主觀能動性,其管理的好壞將直接影響到整個運維管理體系,而不僅僅是運維物件本身。
二、定義各運維物件的運維內容
雲計算資料中心資源管理所涵蓋的範圍很廣,包括環境管理、網路管理、裝置管理、軟體管理、儲存介質管理、防病毒管理、應用管理、日常操作管理、使用者密碼管理和員工管理等。要對每乙個管理物件的日常維護工作內容有乙個明確的定義,定義操作內容、維護頻度、對應的責任人,要做到有章可循,責任人可追蹤。實現對整個系統的全生命週期的追蹤管理。
三、建立資訊化的運維管理平台系統
雲計算資料中心的運維管理應從資料中心的日常監控入手,事件管理、變更管理、應急預案管理和日常維護管理等方面全方位地進行資料中心的日常監控。實現提前發現問題、消除隱患,首先要有完整的、全方位實時有效的監控系統,並著重監控資料的記錄和技術分析。
資料中心的業務可以概括為:通過執行系統來向客戶提供服務。沒有資訊系統的支撐來執行it系統就如超市裡仍然採用手工結賬一樣不能讓顧客滿意。資訊化的資料中心運維管理平台系統包括如下方面:
機房環境基礎設施監控管理系統
it系統監控管理系統
it服務管理系統
四、定製化管理
靈活性、個性化是雲服務的顯著特點,使用者對應用系統有著千差萬別的個性化需求,雲服務提供商在保證共性需求的基礎上,需滿足使用者個性化定製需求,向使用者提供靈活、個性化配置的雲服務系統。雲服務提供商要提供按需變化的服務,就要有反應敏捷的人、流程、工具來適應業務變化的需要。雲服務下的運維需要更多的靈活性和可伸縮性,可以根據客戶、合作夥伴的需要,快速調整資源、服務和基礎設施。
五、自動化管理
it服務根據負載變化可以自動調整所需資源,以求在及時響應和節約成本上取得平衡:同時,計算能力規模越來越大,人工管理資源也越來越不實際。這些新特性對it管理自動化能力提出了更高要求,企業往往希望在不失靈活性的前提下可以得到更高程度的自動化。
為此,雲計算資料中心需要部署自動化管理平台,集中管理
虛擬化和雲計算平台、提供自定義規則定製功能的自動化
解決方案
,使用者通過使用事件觸發、資料監控觸發等方式來自動化管理,節約人力同時提高響應速度。
六、客戶關係管理
雲計算資料中心是為多租戶提供it服務的,為了保留和吸引客戶,在運維過程中客戶關係管理非常重要。
(1) 服務評審:與客戶進行定期或不定期的針對服務提供情況的溝通。每次的溝通均應形成溝通記錄,以備資料中心對服務進行評價和改進。
(2) 客戶滿意度調查:客戶滿意度調查主要包括客戶滿意度調查的設計、執行和客戶滿意度調查結果的分析、改進4個階段。資料中心可根據客戶的特點制定不同的客戶滿意度調查方案。
(3) 客戶抱怨管理:客戶抱怨管理規定資料中心接收客戶提出抱怨的途徑,以及抱怨的相應方式,並留下與事件管理等流程的介面。應針對客戶抱怨完成分析報告,總結客戶抱怨的原因,制定相關的改進措施。為及時應對客戶的抱怨,應該規定客戶抱怨的公升級機制,對於嚴重的客戶抱怨,按公升級的客戶投訴流程進行相應處理。
七、安全性管理
由於提供服務的系統和資料被轉移到使用者可掌控的範圍之外,雲服務的資料安全、隱私保護已成為使用者對雲服務最為擔憂的方面。雲服務引發的安全問題除了包括傳統網路與資訊保安問題(如系統防護、資料加密、使用者訪問控制、dos攻擊等問題)外,還包括由集中服務模式所引發的安全問題以及雲計算技術引入的安全問題,例如防虛機隔離、多租戶資料隔離、殘餘資料擦除以及多saas應用統一身份認證等問題。
要解決雲服務引發的安全問題,雲服務提供商需要提公升使用者安全認知、強化服務運營管理和加強安全技術保障等。需加強使用者對不同重要性資料遷移的認知,並在服務合同中強化使用者自身的服務帳號保密意識,可以提公升使用者對安全的認知;在服務管理方面,嚴格設定關鍵系統的分級分權管理許可權並輔之以相應規章制度,同時加強對合作**商的資格審查與保密教育;加強安全技術保障,要充分利用網路安全、資料加密、身份認證等技術,消除使用者對雲服務使用的安全擔憂,增強使用者使用雲服務的信心。
八、流程管理
流程是資料中心運維管理質量的保證。作為客戶服務的物理載體,資料中心存在的目的就是保證服務可以按質、按量地提供。為確保最終提供給客戶的服務是符合服務合同的要求,資料中心需要把現在的管理工作抽象成不同的管理流程,並把流程之間的關係、流程的角色、流程的觸發點、流程的輸入與輸出等進行詳細定義。通過這種流程的建立,一方面可以使資料中心的人員能夠對工作有乙個統一的認識,更重要的是通過這些服務工作的流程化使得整個服務提供過程可被監控、管理,形成真正意義上的「it服務車間」.
資料中心建立的管理流程除應滿足資料中心自身特點外,還應能兼顧客戶、管理者、服務商與審計機構的需求。由於每個資料中心的實際運維情況與管理目標存在差異,資料中心需要建立的流程也會有所不同。
九、應急預案管理
應急預案是為確保發生故障事件後,盡快消除緊急事件的不良影響,恢復業務的持續營運而制定的應急處理措施。應急預案的注意事項:
(1) 根據業務影響分析的結果及故障場景的特點編寫應急預案,確保當緊急事件發生後可維持業務運作,在重要業務流程中斷或發生故障後在規定時間內恢復業務運作。
(2) 應急預案除包括特定場景出現後各部門、第三方的責任與職責外,還應評估復原可接受的總時間。
(3) 應急預案必須經過演練,使相關責任人熟悉應急預案的內容。應急預案應是乙個閉環管理,從預案的建立、演練、評估到修訂應是乙個全過程的管理,絕不能是為了應付某個演練工作,制定後就束之高閣了,而是應該在實際演練和問題發生時不斷地總結和完善。
十、結語
資料中心作為資訊與資訊系統的物理載體,目前主要用於與it相關的主機、網路、儲存等裝置和資源的存放、管理。只有運維管理好乙個資料中心,才能發揮資料中心的作用,使之能更好地為雲計算提供強大的支援能力。通過有效實施雲計算資料中心運維管理,降低人員工作量的同時提高運維人員工作效率,保障業務人員的工作效率,提高業務系統執行狀況,進而提高企業整體管理效益,同時提高客戶滿意度,實現雲計算資料中心的價值最大化。
雲計算資料中心運維管理的重點
在資料中心生命週期中,資料中心運維管理是資料中心生命週期中最後乙個 也是歷時最長的乙個階段。資料中心運維管理就是為提供符合要求的資訊系統服務,而對與該資訊系統服務有關的資料中心各項管理物件進行系統的計畫 組織 協調與控制,是資訊系統服務有關各項管理工作的總稱。資料中心運維管理主要肩負起以下重要目標 ...
雲計算 資料中心如何「聯姻」
雲計算和資料中心其實已經算是 聯姻 了,不管是我們在談論資料中心還是雲計算的時候,都會把另一方作為非常重要的載體。資料中心要想為使用者提供高可用性的服務就必要借助雲平台的靈活部署方式。而雲計算服務也必須建立在資料中心等硬體平台上。雲計算 資料中心如何 聯姻 雲計算資料中心本質上由雲計算平台和雲計算服...
關於資料中心運維管理概述!
資料中心作為資訊與資訊系統的物理載體,目前主要用於與it相關的主機 網路 儲存等裝置和資源的存放 管理。只有運維好乙個資料中心,才能發揮資料中心的作用,使之能更好地為業務部門提供強大的支援能力。本章從it服務商的角度對資料中心運維管理進行系統的介紹,其出發點在於運維的精確控制 管理水平和服務質量的持...