監控目標確定後,需要選擇合適平台來實現資料收集、展示、以及告警。
經過調研發現小公尺運維部開源出來的openfalcon設計巧妙,元件足夠鬆散,擴容方便,經過大規模資料考驗,周邊生態比較完善。資料展示部分做得比較粗糙,不夠美觀,控制起來不是很方便,果斷選擇展示效果更勝一籌的grafana,grafana有比較絢的展示效果,而且有可以自動化的api使用,很容易實現定製以及程式化生成dashboard,這裡很感謝快網同學為grafana與openfalcon系統橋接外掛程式做出的努力。
openfalcon提供api可以檢視到endpoint下所有的監控項,grafana也可以通過api的方式建立dashboard,根據展示規則,採用程式【定時+手動】化生dashboard【dashboardindex】。
這裡沒有選擇通過在grafana中配置template的方式來展示資料,這種方式效果不太理想,比如:過濾過期資料,展示版面控制個性化描述資訊,使用者檢視展示等。
storm集群的監控
所謂兵馬未動,糧草先行,準備將storm用在某個專案中做實時資料分析。無論任何系統,一定要有監控系統並存,當故障發生的時候你能第乙個知道,而不是讓別人告訴你,那處理故障就很被動了。因此我寫了這麼個專案,取名叫storm monitor,放在了github上 主要功能如下 1.監控supervisor...
storm集群的監控
所謂兵馬未動,糧草先行,準備將storm用在某個專案中做實時資料分析。無論任何系統,一定要有監控系統並存,當故障發生的時候你能第乙個知道,而不是讓別人告訴你,那處理故障就很被動了。因此我寫了這麼個專案,取名叫storm monitor,放在了github上 主要功能如下 1.監控supervisor...
在ubuntu下安裝nagios監控平台
問題1 nagios是什麼?答 是乙個監視系統執行狀態和網路資訊的監視系統。問題2 ubuntu下搭建nagios?答 依賴的軟體包 sudo apt get install apache2 sudo apt get install build essential sudo apt get inst...