前言
泛泛而談
最近一直在幫張琦老師弄一些課程安排的事情,也順便聊了聊現有培訓機制需要改革的方向,拒絕填鴨式的教育是當務之急,討論之餘寫下這篇文章,僅此紀念,別無他意。有競爭力的運維人員應該考慮什麼?且聽熊熊慢慢道來~
執行的職能:包括減少系統宕機時間;依賴各種文件尋找解決方案;根據實際情況進行裝置更新換代(改變老硬體的用途或者淘汰老硬體)
支援的工作:包括高可用、高可靠、高擴充套件性的考慮;服務的範圍(不同的服務範圍需要不同的技能要求);合理的安排時間;
建立文件:非常重要的工作,包括標準化文件(有沒有標準化是衡量乙個運維人員到乙個運維團隊乃至乙個公司的水平的重要依據之一),為硬體打上標籤(注意用可靠的標籤,防止標籤老滑脫落);建立良好的系統安裝文件與客戶維護文件。一句話(文件能力決定你能夠做到什麼位置,這句話一點都不誇張)
工單系統:防止扯皮的最佳辦法。具體應該包括故障工單系統的具體功能(一定要考慮的面面俱到),故障工單系統的使用者接受程度(說白了,有了工單就要嚴格執行,不然設計了跟沒設計有啥區別),隨時追蹤問題解決情況。
災難恢復:提供上位的不二法則,老闆怕什麼,不怕你做了什麼工作業績,那是他花錢請你來覺得天經地義你應該做的。他怕的是你不做的話他會得到哪些損失,而這些損失的提前防範和發生時候的及時恢復(會不會損失資料,損失多少資料,如果不損失資料,多久可以恢復,對未來工作有沒有隱患影響)。
書面政策:包括運維方案策略、備份恢復策略、使用者管理策略、安全防範策略等等,別小看這些,剛才就說了,文件能力決定你能做到什麼位置,考慮的越多,老闆越欣賞你~
具體來說
運維即執行與維護,主要負責公司整體it系統及網路環境的架設與硬體裝置的安裝維護工作。運維不僅是與冰冷的機器打交道,更多時候也是與人打交道(包括公司的外部使用者與內部使用者)。因此所有負責運維工作的人員應該致力為客戶創造乙個穩定、可靠的環境,所有的更新與改造都應該在測試ok的前提下遷移到正式生產環境,用乙個高人的話說,「運維人員最大的成績就是沒有成績(所謂沒有成績就是指伺服器不出問題,讓任何人感覺不到伺服器的異常)」,呵呵,很悲哀吧~
降低系統宕機時間是提供穩定、可靠環境的最低限度保障,沒有客戶能夠忍受昂長的系統宕機時間或者網路癱瘓時間,哪怕他只是想上網看看新聞或者陪好友聊聊qq等等,第一時間發現問題並排除是十分必要的(nagios/cacti等第三方工具提供了監控與報警機制,只需要稍加配置並編寫合適的指令碼,既可以完善你的整體伺服器監控)。
當你進入乙個已經運營很久的公司來當運維的時候,第一時間就是找到他們相關的依賴文件(這點我是深有體會,現在很多知名的網際網路企業,由於種種歷史遺留問題,並不能很好的提供這類文件,可想而知給運維工作帶來多大的困擾)。文件應該包括機房機櫃及硬體裝置的擺放位置,具體的伺服器型號配置及用途,網路拓撲圖,以及相關的產品說明書甚至是合同。
小劉總是跟我抱怨其公司的伺服器太陳舊,以至於無法滿足業務需求,並且沒法更好的進行更新及改造測試,以至於他這次購置伺服器的時候詢問我的意見,我問他新購置伺服器是否考慮與原有伺服器有所關聯,可以採用移花接木的手段,將重要的資料庫系統遷移到新的伺服器中,將一些實在太老的伺服器,能整合的整合,不能整合的就直接淘汰掉吧,要知道,用在老舊伺服器維護上面的成本要遠遠高於採用新伺服器的價錢~
這裡只是說一下工單主要包括的內容。好的工單系統應該包括請求狀態,響應狀態,處理人員,處理時間,反饋時間等等這些基本方面,而考量乙個運維人員應該包括開出的工單數量,響應數量,完成數量,未完成數量,未完成原因,完成時間,錯誤重複出現率等等。乙個工單制度,需要各部門的配合,否則不能做到上行下效,那麼工單只是一紙空文罷了~
最後再說說文件,這裡面的學問可大了,文件降低了發生單點故障的可能性,有助於減少重複的操作,查閱文件可以更快的解決問題以節省時間,而且建立統一的標準化文件更利於團隊整體維護工作,不要介意將解決方法公布於眾,因為那些是早晚都會被人家知道的,技術的提高在於共享,這個道理很簡單,如果你會了,那麼你就算共享了,你依然是高手,如果你不會,通過共享你得到提高,也能夠更好的開展工作。良好的文件能力必不可少~
一家之言,僅供參考,如有紕漏,還望不吝賜教~
個人blog:
運維那點事
前言 泛泛而談 最近一直在幫張琦老師弄一些課程安排的事情,也順便聊了聊現有培訓機制需要改革的方向,拒絕填鴨式的教育是當務之急,討論之餘寫下這篇文章,僅此紀念,別無他意。有競爭力的運維人員應該考慮什麼?且聽熊熊慢慢道來 執行的職能 包括減少系統宕機時間 依賴各種文件尋找解決方案 根據實際情況進行裝置更...
自動化運維那點事
前些天參加乙個乙個運維沙龍 茶歇的時候和中信服的以為負責人聊天,他很有激情,說最近在籌備做一套自動化運維的解決方案,和他們的其他解決方案一起賣給客戶 好想法,的確,最近自動化運維炒得火熱,中小企業們也喊著口號 不做自動化運維就不叫運維。這裡簡單的介紹一下何謂自動化運維。自動化運維概念會被重視是情理之...
運維那些事
運維,這裡指網際網路運維,通常屬於技術部門,與研發 測試 系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。乙個網際網路產品的生成一般經歷的過程是 產品經理 需求分析 研發部門開發 測試部門測試 運維部門部署發布以及長期的執行維護。對於初創公司,運維部...