Nagios 郵箱告警的方式太OUT了!

2021-09-19 17:21:40 字數 1957 閱讀 8030

一般來講,在安裝完 nagios 後,我們做的第一件最正確的事,就是設定它的郵件通知,對吧。因為如果沒有這一步驟的話,你怎麼能夠知道什麼時候會出現問題呢?

伴隨著成功的初始安裝,你即將是你司唯一乙個能夠接收到告警資料的人。nagios 的乙個很好的功能就是可以監控到不同的伺服器。人生如夢,這種蜜月期並不會持續太久,很快事情就會從很好處理變得開始難以操縱,等到你意識到已為時晚矣———每天都會有幾十個甚至上百個告警鋪天蓋地的蜂擁而至。你試圖去理清這些永無休止、有如浪潮般的告警郵件,但依然是剪不斷,理還亂......

說實話,告警資訊真沒必要非得弄得諸如此般狼狽不堪的模樣。以下列出了關於有效告警的幾個方面,並且告訴大家 nagios 郵箱告警的不可取之處。

請注意,告警資訊都是動態的,即並非是靜態的一成不變的

當這些告警資訊以電子郵件的方式進入到你的郵箱後,它們就不會再發生改變了,然而現實中的告警卻是無時無刻的不在變化。這意味著你將會每一刻都收到狀態發生了改變的告警電子郵件,導致你檢視郵件時很難搞清哪乙個告警才是當下發生的。這時候小夥伴兒們就該說了,解決此類問題很簡單啊,只單單檢視最近時間的一些告警郵件即可,說的簡單,同志們,試想一下,你登陸郵箱後成百上千封郵件撲面而來,你從中很快速的篩選出離得最近的有效告警郵件,並且這些告警恰恰能夠把你系統出現的所有問題都涵蓋到,並且去一一解決,做到無一遺漏,現實嗎?

應用效能管理告警壓縮

nagios 是基於伺服器和主機形式的告警監控,這就意味著,如果一台伺服器有多項問題,那麼每乙個問題都會對應傳送出乙個相關的郵件。你只能自己通過界定他們之間的依賴關係,來嘗試解決告警問題。在現代化環境中,我們發出的更多的是應用效能管理告警,而並不是特定的伺服器或是主機。

例如,在一百臺伺服器中,如果只有一台出了問題,碰巧除此之外其餘所有的伺服器都在如期的正常工作中,我們就用不著整晚都在修復中度過了。而如果有五十臺伺服器宕了,那就是非常嚴重的報警了,但我們一下子也處理不了五十個告警呀。因此,我們更習慣於只接受到有關應用層面的乙個壓縮告警,告訴我有多少伺服器受到了影響,又有多少伺服器依然是在正常的執行中,好讓我能夠對當下出現的問題一目了然。

告警分析

通常情況下,在解決告警或者完全弄懂告警的問題上,告警資訊的監控其實並不到位。比如我現在手頭上有乙個問題,那麼往往得到更多的告警資訊才能夠大幅度地減少解決這個問題的時間。

例如,一台伺服器超負荷了,如果我們能看到最近幾小時的 cpu 圖表,並且能了解到應對此問題做出高階指令後的執行結果,會對我們解決告警起到至關重要的作用。這些完全可以用 onealert 的分析功能來實現,但這僅僅這也是該功能的冰山一角。如果你還能看到這個問題發生時的最近告警事件的柱狀圖,又或者是在這一段時間中,發生在你的系統中所有資訊的一系列變化,包括告警事件次數、平均確認時間、平均解決時間等,會不會是超讚的呢?

可控的單單獲取內容是不夠的,比如現在,當我收到乙個告警的時候,介於我正在忙其他更重要的事情,我想指派給某人來處理此告警,又或者是這個報警本身就應該由相應的人來處理,系統必須正確的把報警資訊指派給特定的人,該怎麼辦呢?更深一層次的說,我們需要有大量的可控化操作,比如勘察記錄、人工指派、逐層分級以及解決問題的分享等。

團隊協作

乙個團隊如果能夠很好的互相協作,會使得很多事情變得很好解決,但團隊中處理 nagios 的郵件報警有的時候真的是很痛苦。讓我們來看一看那些堆積郵件如山的郵箱吧,你怎麼知道是否有人已經做出了正確的答覆?你又該如何快速的將乙個告警,開放式的分配指派給他人,又或者請教他人解決的方式呢?你能夠看到團隊其他成員關於某一事件的最後一次告警作出的詳細筆錄嗎?這些看似簡單的問題,對於郵箱告警來說基本不可能實現。

nagios 很難制定人性化的程式。我們知道,只有得益於一些外掛程式和先進的配置的幫助,問題才會得到更好的解決。把控系統的所有可能性,並且持續的維護它們是 onealert 的使命。僅僅舉幾個例子:告警壓縮、告警分析、指派分配、告警記錄、團隊分享等太多太多了……那麼問題來了,你應該如何開始管理你的監控系統?

onealert 專注於解決處理以上所有的痛點,不要驚奇,想來了解一下嗎?現在還可以免費體驗,趕快行動吧!

Nagios 快速實現資料視覺化的幾種方式

nagios 是一款強大的開源監控軟體,但他本身不能繪圖,只能檢視當前資料,不能看歷史資料以及趨勢,也正因此,想要更舒適的使用就要搭配繪圖軟體,現在可搭配的繪圖軟體有很多,例如 pnp4nagios,rrdtools,grafana,cacti,以及 cloud insight 有的還要搭配使用。本...

Nagios 快速實現資料視覺化的幾種方式

nagios 是一款強大的開源監控軟體,但他本身不能繪圖,只能檢視當前資料,不能看歷史資料以及趨勢,也正因此,想要更舒適的使用就要搭配繪圖軟體,現在可搭配的繪圖軟體有很多,例如 pnp4nagios,rrdtools,grafana,cacti,以及 cloud insight,這些軟體和 nagi...

Nagios 快速實現資料視覺化的幾種方式

nagios 是一款強大的開源監控軟體,但他本身不能繪圖,只能檢視當前資料,不能看歷史資料以及趨勢,也正因此,想要更舒適的使用就要搭配繪圖軟體,現在可搭配的繪圖軟體有很多,例如 pnp4nagios,rrdtools,grafana,cacti,以及 cloud insight,這些軟體和 nagi...