隨著企業伺服器數量越來越多,當到達幾百台,上千臺伺服器之後,伺服器日常管理也逐漸繁雜,每天如果通過人工去頻繁的更新或者部署及管理這些伺服器,勢必會浪費大量的時間,而且有可能人為的操作也會造成某些疏忽而遺漏。那我們來看一下傳統的運維以及今後運維的發展方向。
傳統的it運維仍然是等到
it故障出現後再由運維人員採取相應的補救措施。這種被動、孤立、半自動式的
it運維管理模式經常讓
it部門疲憊不堪,主要表現在以下三個方面:
1)運維人員被動、效率低 在
it運維過程中,只有當事件已經發生並已造成業務影響時才能發現和著手處理,這種被動「救火
」不但使
it運維人員終日忙碌,也使
it運維本身質量很難提高,導致
it部門和業務部門對
it運維的服務滿意度都不高。
2)缺乏一套高效的
it運維機制
目前許多企業在
it運維管理過程中缺少自動化的運維管理模式,也沒有明確的角色定義和責任劃分,使到問題出現後很難快速、準確地找到根本原因,無法及時地找到相應的人員進行修復和處理,或者是在問題找到後缺乏流程化的故障處理機制,而在處理問題時不但欠缺規範化的解決方案,也缺乏全面的跟蹤記錄。
3)缺乏高效的
it運維技術工具
隨著資訊化建設的深入,企業
it系統日趨複雜,林林總總的網路裝置、伺服器、中介軟體、業務系統等讓
it運維人員難以從容應對,即使加班加點地維護、部署、管理也經常會因裝置出現故障而導致業務的中斷,嚴重影響企業的正常運轉。出現這些問題部分原因是企業缺乏事件監控和診斷工具等
it運維技術工具,因為在沒有高效的技術工具的支援下故障事件很難得到主動、快速的處理。
it運維已經在風風雨雨中走過了十幾個春秋,如今它正以一種全新的姿態擺在我們面前
--自動化,這是
it技術發展的必然結果。現在
it系統的複雜性已經客觀上要求
it運維必須能夠實現數位化、自動化維護。
運維自動化是指將
it運維中日常的、大量的重複性工作自動化,把過去的手工執行轉為自動化操作。自動化是
it運維工作的昇華,
it運維自動化不單純是乙個維護過程,更是乙個管理的提公升過程,是
it運維的最高層次,也是未來的發展趨勢。
日常it
運維中大量的重複性工作(小到簡單的日常檢查、配置變更和軟體安裝,大到整個變更流程的組織排程)由過去的手工執行轉為自動化操作,從而減少乃至消除運維中的延遲,實現
「零延時」的
it運維。
簡單的說,
it運維自動化是指基於流程化的框架,將事件與
it流程相關聯,一旦被監控系統發生效能超標或宕機,會觸發相關事件以及事先定義好的流程,可自動啟動故障響應和恢復機制。
建立高效的
it自動化運維管理步驟主要包括以下幾點:
1)建立自動化運維管理平台
it運維自動化管理建設的第一步是要先建立
it運維的自動化監控和管理平台。通過監控工具實現對使用者操作規範的約束和對
it資源進行實時監控,包括伺服器、資料庫、中介軟體、儲存備份、網路、安全、機房、業務應用和客戶端等內容,通過自動監控管理平台實現故障或問題綜合處理和集中管理。
2)建立故障事件自動觸發流程,提高故障處理效率
所有it
裝置在遇到問題時要會自動報警,無論是系統自動報警還是使用人員報的故障,應以紅色標識顯示在運維螢幕上。然後
it運維人員只需要按照相關知識庫的資料,一步一步操作就可以。
3)建立規範的事件跟蹤流程,強化運維執行力度
需要建立故障和事件處理跟蹤流程,利用**工具等記錄故障及其處理情況,以建立運維日誌,並定期回顧從中辨識和發現問題的線索和根源。 4)
設立it
運維關鍵流程,引入優先處理原則
設定自動化流程時還需要引入優先處理原則,例行的事按常規處理,特別事件要按優先順序次序處理,也就是把事件細分為例行事件和例外關鍵事件。
對於企業來說,要特別關注兩類自動化工具:一是
it運維監控和診斷優化工具;二是運維流程自動化工具。
這兩類工具主要應用於: 1)
監控自動化:是指對重要的
it裝置實施主動式監控
,如路由器、交換機、防火牆等。
2)配置變更檢測自動化:是指
it裝置配置引數一旦發生變化,將觸發變更流程轉給相關技術人員進行確認
,通過自動檢測協助
it運維人員發現和維護配置。
3)維護事件提醒自動化:是指通過對
it裝置和應用活動的時時監控
,當發生異常事件時系統自動啟動報警和響應機制
,第一事件通知相關責任人。
4)系統健康檢測自動化:是指定期自動地對
it裝置硬體和應用系統進行健康巡檢,配合
it運維團隊實施對系統的健康檢查和監控。
5)維護報告生成自動化:是指定期自動的對系統做日誌的收集分析
,記錄系統執行狀況
,並通過階段性的監控、分析和總結
,定時提供
it運維的可用性、效能、系統資源利用狀況分析報告。
乙個完善的自動化運維體系包括系統預備、配置管理以及監控報警
3 個功能:
系統預備 1)
自動化安裝作業系統及常用軟體包
配置管理 1)
自動化部署業務系統軟體包並完成配置
2)遠端管理伺服器(開關服務等)
3)變更回滾
監控報警 1)
伺服器可用性、效能、安全監控
2)向管理員傳送報警資訊
根據提供的功能不同,自動化運維工具軟體分為以下
3 類,如下表所示:
萌萌的it人
暢聊Linux系統運維的未來
我想來跟大家聊聊linux運維這一行業,從幾個方面說下行業的現狀 如何學好linux和如何成為專業運維人員以及雲服務對運linux運維的影響。我們都知道從1991年linux開始火爆全球,蔓延至中國,隨著智慧型中國 網路繁榮發展,眾多應用基本都跑在linux伺服器上面,但對於大多數人來說還是不太了解...
linux運維及常用方法
運維,這裡指網際網路運維,通常屬於技術部門,與研發 測試 系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。乙個網際網路產品的生成一般經歷的過程是 產品經理 需求分析 研發部門開發 測試部門測試 運維部門部署發布以及長期的執行維護。linux運維即li...
linux服務監控及運維
目錄 1.1 安裝壓縮包 以root身份登陸centos依次 執行以下命令 wget 如果wget 下不下來,則直接在瀏覽器中複製 貼上鏈結 下來,用ftp傳輸工具傳輸到linux上,然後再進行下面的操作 1.2 解壓 tar zxvf psutil 2.1.3.tar.gz 1.3 進入解壓完的目...