資料中心的敏捷運維之路

2021-09-23 09:51:35 字數 2123 閱讀 4113

隨著資料中心的建設規模越來越大,出現了很多大型,特大型的資料中心。這些資料中心往往擁有數萬臺的伺服器規模,再加上互聯的網路裝置、防火牆、負載均衡等裝置,乙個大型資料中心需要管理同時執行的幾萬臺裝置,並且資料中心的業務仍然在不斷變化,幾乎天天都要做各種各樣的網路變更,同時也不斷有裝置出現這樣那樣的故障問題。資料中心規模增加一倍,在運維上面就要增加投入數倍的力量,這樣在資料中心不斷擴建的過程中,運維的工作已經不堪重負,一味增加運維的投入將嚴重影響資料中心整體效益,而且大量投入得到的效果並不見得好。在這樣的背景下,什麼自動化運維、遠端運維、智慧型網管,還有敏捷運維等都紛紛出現了,經過了這幾年的技術演進,前幾種幾乎無人再提及,只有敏捷運維卻變得越來越火。如今,每年都有全球敏捷運維峰會,在多個地方舉辦數次,吸引著諸多資料中心運維技術人員參與。大家發表對資料中心運維的看法,相互學習,促進敏捷運維的完善和發展。

和敏捷運維相比,敏捷開發的概念相信早已被更多人所熟知。敏捷開發是一種以人為核心、迭代、循序漸進的開發方法。在敏捷開發中,軟體專案的構建被切分成多個子專案,各個子專案的成果都經過測試,具備可整合和執行的特徵。敏捷開發概念從2023年初就開始廣為流行了,經過這十幾年的發展,在所有的軟體開發專案中,都基本引入了敏捷的軟體管理理念,這時有人想到了將敏捷設計引入到資料中心運維當中,以便解決當前運維效率低下的問題。敏捷運維的概念來自於兩個截然不同的技術陣營。一方面是敏捷開發者發現,雖然產品被很快設計出來,但部署卻比較花費時間,手動部署和配置也會引入很多人為錯誤。此時,敏捷開發團隊希望可以自動完成所有重複性的任務,當然也包括部署在內。另一方面來自於一些網際網路公司,這些公司業務增長飛快,有時會在兩個星期內就要增加上千臺伺服器,單純人工的方式完成,耗費了大量人力,運維成本太高,這時他們想到了敏捷設計,希望將敏捷設計應用到運維當中,實現敏捷運維。和敏捷軟體開發一樣,敏捷運維與傳統的資料中心人工運維管理完全不同,敏捷運維完全自律,按照設定好的程式去執行,確保所有一切內容都在控制之內,敏捷運維引入了自動化的東西,拋棄了手動操作。

敏捷運維試圖將人們從複雜、繁重的工作中解決出來,通過軟體自動化管理,滿足資料中心的擴容要求,於是出現了很多敏捷運維的工具,很多人以為只要使用這些工具就是敏捷運維了,實際不是這樣的。就像我們擁有了電腦,會使用電腦,但不一定會用電腦完成各種程式設計,輸出很多的功能軟體。電腦只是乙個工具,我們需要通過給電腦一些指令,才能按照我們的意圖完成。在敏捷運維中,軟體工具就是這樣的角色,必須要我們給予它各種處理業務的能力,它才能自動完成,只要我們設計好了未來資料中心故障、擴容、業務變更遇到的場景,賦予工具自動操作的權利,那麼工具就會按照我們設計的程式去自動執行。為工具制定各種各樣的自動執行指令碼,是敏捷運維的關鍵,這些指令碼關係到敏捷運維的可用性。尤其是在突發事件的處理上,大規模業務擴容上的表現。

敏捷運維給資料中心帶來的好處是顯而易見的。可以大大減少資料中心在運維方面人力的投入,即使在資料中心規模不斷擴大的情況下,使用敏捷運維的工具就可以完成自動化部署,不再需要增加運維人員,只不過在運維工具監控之中增加一些點而已;可以節省運維費用支出,提公升資料中心的運營能力;實現業務的快速自動部署,資料中心擴容在手指間就可以輕鬆完成,運維人員不再需要關心基礎架構的實現,只需要在敏捷軟體上做業務部署即可,底層資源調配,網路配置等均通過軟體實現自動下發,自動互聯互通;減少資料中心故障中斷時間,甚至可以做到全年無中斷,敏捷軟體能夠在毫秒級的時間內發現異常,並自動執行切換動作,將業務轉移到備用系統中,確保業務不受影響,敏捷軟體還可以對故障進行自癒,嘗試對故障進行隔離,為人員搶修故障裝置贏得時間。

敏捷運維聽起來很美好。只要嵌入你的**,確保它在伺服器上構建,然後更新乙個方法,就可以按照你的思路去完成自動運維。這個說起來容易,實際做起來很難。現有的軟體定義資料中心仍處於發展的初級階段,還沒有這樣一種軟體,可以對整個資料中心裝置很好地以控制軟體實現,因為資料中心裡裝置千差萬別,相同裝置軟體版本不同,實現也會有差異,這樣從軟體上很難統一管理。即便可以管理,那麼什麼時候執行什麼樣的指令,敏捷軟體工具自己不會去考慮,依然是由你來完成,這樣就需要將所有可能出現的場景,業務的走向部署都需要考慮到,並通過軟體指令碼實現,設計得越充分,敏捷軟體工具功能就越強大,當然如果依然出現了未知情況,敏捷運維也會失效。所以針對敏捷運維進行的敏捷開發非常重要,這將在很大程度上決定敏捷運維的效果。

隨著資料中心規模不斷擴大,業務複雜性越來越高,運維團隊面臨著嚴峻的新挑戰,不僅要以更快的速度,在更動態的環境中部署更多創新性的服務,同時還要始終確保使用者的滿意度。如何用好敏捷運維,已經成為當下資料中心最迫切需要掌握及推進的革新技能。

本文**d1net(原創)

資料中心智慧型化運維之路

在新技術層出不窮的今天,資料中心運維工作總是得不到足夠的重視。資料中心在不出任何問題的情況下,對運維的工作是持預設態度的,但如果出了一系列問題,付出的工作可能毀於一旦,工作的績效有點要拼人品的味道。其實,正如那句話所說的 古羅馬不是一天建成的 那樣,資料中心發生了故障,甚至是致命的故障,很多時候並不...

資料中心運維指令碼的力量

運維是資料中心生命週期中持續時間最長的一部分,隨著資料中心建設規模和複雜度的增加,運維的工作變得更加繁瑣。在運維的工作中,有相當大部分工作都是重複性的指令行操作。所以,不少的運維工程師研究出不少提公升工作效率方法,減少人力成本,這就是指令碼。將一些重複性的 邏輯關係明確的操作工作通過指令碼下發來完成...

IDC資料中心運維的 風火水電

本篇介紹下資料中心運維管理的 風火水電 1.風 空調製冷,專業伺服器機房內溫度常年保證 22度左右,保證伺服器長期穩定執行所需要的散熱溫度環境。2.火消防,專業伺服器機房內有大量伺服器裝置,有大量的強 弱電裝置,伺服器機房消防是相當重要的一部分。3.水 濕度 防潮,專業伺服器機房內大量伺服器裝置對環...