伺服器告警機制配置技巧 避免草木皆兵
現在的伺服器都配置了成堆的感測器,一旦任何感測器發生狀況都會發出告警,令人頭昏目眩。但是管理員必須盡早知道:伺服器監控工具產生的告警不一定都重要。
現在的伺服器都配置了成堆的感測器,一旦任何感測器發生狀況都會發出告警,令人頭昏目眩。但是管理員 必須盡早知道:伺服器監控工具產生的告警不一定都重要。如果伺服器動輒發出警報,那你會在短時間內被迫接收大量資訊,其中真正重要的資訊可能會被淹沒。本 文的目的就是幫助管理員認清哪些伺服器告警是重要的,管理員需要伺服器監控工具怎樣正確提供警報。
配置告警機制的技巧
在開始之前,我想先指出一點:配置告警並沒有絕對正確或錯誤的方法。本文中的建議主要基於我二十年的it經驗,但它們終歸是我個人的偏好。所以,雖然希望你們能從我的建議中獲取好處,但我更建議每個管理員配置伺服器告警時,盡量緊貼與自己公司的特定要求。
另一點我要指出的是:管理員可以用很多方法讓伺服器產生告警。有的伺服器可以在硬體級產生告警,這雖然很有用,但還遠遠達不到作為獨當一面的告 警機制的要求。伺服器**商提供的伺服器監控工具有大量資訊,作為作業系統級的伺服器監控工具,比如微軟的system center operations manager。因為監控工具的選擇很多,我會普遍地講一講,而不是單獨講某個特定的工具。
為伺服器告警機制配置優先順序
想讓伺服器監控變得有效,關鍵在於對監控工具的告警機制進行優先順序配置。我推薦把告警分為高階、中級、低階三種。
我通常把優先順序高的告警定義成最最關鍵的事務。比如,伺服器磁碟空間全部耗盡就是乙個關鍵事件,同樣乙個群集化應用伺服器出現故障也會釀成大禍。
中級優先順序的告警比較難以定義。我所認為的中級告警可能對於其他組織來說是高階的。對我來說,如果警報中的問題不會帶來整體停機,那麼優先順序就 是中級。比如說乙個群集中的某個節點不知道為什麼斷電了,但不會影響整個群集的執行,那我就把它定義為優先順序中級。當然這和所處的工作環境有很大關係。我 任職過的一些大公司就把這類問題定義為關鍵事務。
但是,如果你的公司不能容忍任何宕機事件發生,那比較聰明的方法就是根據問題是否有發生故障的潛在風險來決定優先順序。比如說你有乙個raid列 陣,能夠在不離線的情況下處理兩個磁碟的失誤,那如果其中乙個故障了,你可以把這件事當成中等優先順序的告警,因為該陣列還能正常處理另乙個磁碟的故障。但 如果兩個磁碟都發生故障,那就是高等優先順序了,因為如果還有乙個磁碟故障,那整個陣列就完了。
雖然我覺得這種方法評定優先順序很好用,但是比起簡單地在故障時觸發告警,根據部件數量來配置告警更難。依靠了你使用的監控的種類及其監控軟體的可用功能,安裝這種告警系統是值得選擇,毫無疑問的。
配置監控機制
而優先順序中等的告警雖然重要,但不是絕對關鍵的,所以我傾向於通過電子郵件傳送。如圖所示,windows server有傳送電子郵件的功能,這意味你很容易就能根據作業系統內發生的時間來傳送郵件告警。
windows能自動傳送電子郵件告警
我每天檢查電子郵件,所以告警不會被忽視,有的告警我可能並不想通過手機第一時間知道。中高階的區分很重要,我並不想在和朋友歡度週末的時候, 還得為中等優先順序的告警所打擾。當然這只是告警工作的乙個例子,還有其他選項。比如有個公司叫server density,他們裝了乙個iphone的伺服器監控應用程式,支援所有的告警。
當然,高等優先順序的組成物件還是有待**的,還有一件事情得考慮一下,就是高優先順序的告警不一定和系統故障有關。大部分伺服器只要系統case 開啟了,就能觸發告警。如果能開啟伺服器case的只有你,那乙個case的警報顯然就是高等優先順序的告警。同樣,溫度過高的告警也是高優先順序的,因為服 務器過熱最終會導致停機。
0 給主人留下些什麼吧!~~
伺服器篇 linux伺服器配置小技巧
ssh登入連線伺服器時,預設的連線超時時間很短,經常會斷掉,為方便管理修改sshd的配置檔案,然後重啟sshd服務。vim etc ssh sshd config 查詢並修改 clientaliveinterval 0 clientaliveinterval 120 服務端向客戶端器請求訊息的間隔 ...
伺服器安全配置技巧 高階篇
伺服器安全配置技巧 高階篇 5.加密temp資料夾 一些應用程式在安裝和公升級的時候,會把一些東西拷貝到temp資料夾,但是當程式公升級完畢或關閉的時候,它們並不會自己清除temp資料夾的內容。所以,給temp資料夾加密可以給你的檔案多一層保護。6.鎖住登錄檔 在windows2000中,只有adm...
配置伺服器
今天我們的程式要配置一台新的伺服器 我把程式整理一下放了上去,程式上傳完成了準備配置程式了 程式是分三部分的,乙個是web的程式是用asp寫的,乙個是flash部分,還有就是c 服務部分了,asp和flash都沒有什麼大的問題,首先我準備開起服務,因為服務要驗證的。通過訪問個web位址驗證的,當時也...