Prometheus 監控基礎與概述

2021-10-19 13:34:08 字數 792 閱讀 1398

監控乙個系統有多個原因,包括如下幾項:

趨勢分析

資料庫當前的資料量,以及增長速度,又比如日活使用者的增長數量;

跨時間範圍的比較,或是找出各組之間的區別

使用apache 與 nginx 作web伺服器,哪個速度更快?增加node數量,memcache的快取命中率是否增加,**是否比上週的訪問速度加快?

警報

某項服務出現了故障,需要有人立刻修復;或者某項服務已經達到警告閾值,馬上會出現故障,需要人為介入排查。

監控視覺化

監控視覺化可以直觀的回答一些服務的基本問題,經常會包括四個**指標

臨時行增長分析

請求延遲增加,載入速度過慢,有沒有其他類似的現象發生?

系統監控不僅僅是監控與警報,還可以給業務分析提供原始資料和分析安全入侵的場景也有一定作用,比如當前業務的使用者增量幅度以及入侵時候的access log的分析等;

監控與告警可以給讓乙個系統在發生故障時,主動通知我們,或者告訴我們即將發生什麼。當系統無法自動修復【自癒】的時候,需要人為介入來檢查這個警報的源頭與原因,用以決定故障的真實性,採取有效措施,解除故障。

對於緊急警報過於頻繁,導致無效資訊過多,從而懷疑警報的有效性甚至可能會忽略掉警報,忽略掉了真實的故障。同時,在分析與修復過程中,因無效資訊過多,導致排查時間增加,修復變慢,故障時間延長。

由此可以看出,構建乙個高效的警報系統是多麼重要,而高效的警報系統提供的資訊是足夠的有效資訊,用以降低誤報率與提高效率。

Prometheus(一)監控基礎

prometheus是乙個開源的監控系統,它從應用程式中實時獲取時間序列資料,然後通過功能強大的規則引擎,幫助你識別監控環境所需的資訊。本書將指導你使用prometheus來構建監控系統,重點將放在 動態雲環境 kubernetes環境和容器環境的監控。同時,我們還將研究如何從應用程式獲取資料並將這...

Prometheus 監控節點

tar xf node exporter 0.18.1.linux amd64.tar.gz cd node exporter 0.18.1.linux amd64 cp node exporter usr local bin 檢視版本 root server03 media prometheus ...

prometheus監控exporter部署

harbor exporter docker run d p 9107 9107 restart always network harbor harbor add host mec hub.21cn.com x.x.x.x e harbor username admin e harbor passw...