最近我花了乙個月的時間和企業一對一的去溝通運維,去了解運維,特想和大家分享一下這個資訊。以前的方式是我講,大家聽,這次是他們講,我聽,同時在講講我的具體理解。超過20家的受訪企業大致分布如下:網際網路:40%,傳統行業:24%,銀行:24%,運營商12%。
其實這樣的計畫看到很多傳統企業/銀行和運營商都非常關注網際網路運維是怎麼玩的?我根據最近的訪談情況,提出運維的四力模型,從這個模型裡面,我們來看看到底還有什麼樣的資訊。
傳統的維護走向運維是有兩種作用力產生的:
1.結構力
無論是網際網路還是傳統企業,都是基於不可靠硬體x86構建起的it體系(研發/測試和運維),這就決定了思維上的兩種變化,第一種是不可靠性需要應用的技術架構來配合實現高可用(需要ops進入到dev過程);第二種是去中心化/分布式/面向應用/零維護能力的底層系統,更需要運維能力的保證(需要ops更強的能力提供),我想這是大家不斷找我講運維主要原因。
可以說在網際網路行業,是經歷了乙個迭代式的發展過程,能力從0到1到n。但在傳統行業和銀行,這個過程不是迭代漸進式的,之前受去ioe的影響,最近受國產化的影響,也有業務網際網路化的影響,傳統的高可用硬體架構必須轉向不可靠的x86架構。系統工程裡面都說,結構決定功能。不可靠的結構帶來了不可靠的能力,此時就更需要全面的運維能力來彌補。運維能力是什麼?是運維規範/是平台能力/是視覺化運維能力/是端到端監控的能力/是技術架構自適應和可運維能力.....很多很多。
實際的企業訪談情況是,x86是一種必然的趨勢,網際網路企業不消說了,在銀行/運營商也是如此哈!
我把這種力理解成一種內力。
2.變革力
這個變革力是業務形態變化帶來的,就是業務的網際網路化。業務網際網路化之後,使用者的需求持續反作用於it交付流程。以前的it交付流程,幾個星期的乙個版本顯然不能滿足市場競爭的要求,逼著企業走到持續迭代和快速試錯的機制上。傳統企業很多人都在問,網際網路能夠快速的秘訣是什麼?有大系統小做(微服務),服務公共化,服務向前相容,灰度發布,持續整合,持續部署,運維規範化等等諸多手段。
或許你認為這種外力帶來的是對自動化平台能力的很高要求,其實這只是其中乙個方面,還有乙個更重要的方面就是使用者服務及系統狀態的變化監測和修復能力。頻繁變更的系統,偶爾會導致系統不穩定,如何保證運維有快速發現/快速定位/快速恢復。這是乙個監控系統上的能力要求,傳統的監控需要進行改變,但這個監控系統需要業務系統上做一些配合支援才行。
通過實際的訪談發現,網際網路的發布頻率明顯高於傳統行業,這是業務對內還是對外的差異,小到幾倍,大到幾十倍的差距都有,因此該變革力在網際網路和傳統企業是不同的。
這種變革力對運維的要求也相應的就來了,如何完成快速的服務交付和服務狀態穩定保障,這是乙個挑戰。這個挑戰來自於多方面的,第
一、有運維平台層面的,比如說運維平台能力不足;第
二、有組織設定層面的,煙囪式/豎井式的企業組織結構,能力傳導特別弱;第
三、有企業文化層面的,是流程驅動文化,還是技術驅動文化,運維能力也不同。
業務網際網路化是一種很強的外力。
基於以上內力+外力的相互作用的結果,運維需要新的變化,才能走出運維苦逼,無價值的境地,從而真正給新it組織形態下傳遞更多的it能力。
3.控制力
我把運維組織理解成兩種型別,面向科學管理時代的組織職能化,每個單元負責特定的職能(function)。在業務網際網路化的今天,通過建立面向產品/業務的跨職能(cross-functional)組織來應對敏捷和快速變化的使用者要求。傳統企業大部分還是職能化的組織架構,而網際網路企業都是面向產品的事業部制。跨職能的組織結構,有很強的能力傳導效應。
但從運維的角度來說,我還是把運維歸到類似公共服務能力部門,此時運維必須建立一種控制力,這個控制力有組織層面的,也有業務層面的。組織層面的,需要集中的運維控制組織,這有利於能力的服務化封裝,從底到上都是如此,比如說網路服務/資料庫服務,甚至是上層應用(系統或者叫業務)運維等等。另外一種情況,組織中沒有應用運維角色,導致面向業務的運維控制能力進一步減弱,運維淪為資源服務的提供者。
嚴格禁止運維隨著研發走,特別是對於乙個多部門或者多產品組織中,每個部門/產品組帶乙個運維小組。
我的觀點對於乙個網際網路化的業務來說,應用運維+集中式的運維組織結構必須是組織建設的兩個重要因素。
企業實際的情況是,我訪談的大部分企業都很難建立真正的控制力,核心是沒有建立面向業務的集中式運維組織架構。我給很多網際網路企業的建議是,必須走向這樣的架構,我給傳統企業的建議是,建立面向業務的運維孵化組織,讓他們按照新的模式執行,儲備新的能力。
4.驅動力
由控制力形成的驅動力,控制力之後,運維逐漸形成對面向業務型的運維理解。此時運維會整體性規劃其運維體系,並付諸到後續的階段性實現計畫中。運維的驅動力也來自於多個方面,第乙個是平台層面的,第二個是規範層面的,第三個是意識和文化層面的。
平台層面的,運維必須建立標準化的自動化和資料化的平台,來驅動devops。規範層面的,運維需要建立自己的運維規範,包含線上服務環境的運維規範,也包含技術架構的規範,還包含自己的運維服務規範等等。一定要注意,運維規範必須要從線下走向線上,從流程走向技術服務等等。意識和文化層面,要不斷的和研發強調,運維不是維護,運維不是負責資源管理的,運維可以主動承擔更多,這種承擔會直接影響it組織的效能。
很多企業實際的情況是控制力偏弱,導致驅動力很弱。乙個好的運維組織是高效能it組織的保障,高效能it組織到底有什麼好處?在2023年puppetlabs的devops報告中有體現:
總結一句話,底層it基礎設施的變化,外加業務形態的變化,都在迫使運維的轉型,此時須建立集中式運維組織,從而形成真正的運維驅動力。
網際網路 網際網路 全球資訊網的區別
網際網路 網際網路 全球資訊網的區別 1.網際網路 internet 凡是能彼此通訊的裝置組成的網路就叫網際網路。即使僅有兩台機器,不論用何種技術使其彼此通訊,也叫網際網路。2.網際網路 internet 網際網路可不是僅有兩台機器組成的網際網路,它是由上千萬臺裝置組成的網際網路,是全球最大的使用人...
物聯網需要自己的網際網路嗎?
origin 的確,從目前的情況來看,移動運營商可以信心滿滿。他們的 2g 3g 網路是目前物聯網的主要承載網。隨著手機的滲透率趨於飽和,也許移動運營商的未來真的要指望 m2m 的使用者了。但是一家名為 sigfox的法國初創企業決心要挑戰這種思維。他們認為,現在的流動網路要連線的是人,不是物體。物...
網際網路你需要了解的
一些自己的感悟,之前自己太不努力了,現在開始努力學習,將一些感悟體會,學習到的分享出來 之前一直沒有理解,只是侷限於web的前後端,原來ios和android開發其實就像是web的前端一樣,頁面的跳轉,彈窗,提示,展示 前端是使用者直接去使用的,感官很強,會有一些簡單的處理,但是其實主要還是介面流暢...