prometheus配置
1、常用引數詳解
[root@localhost ~]# /usr/local/prometheus/prometheus -h
--config.file="prometheus.yml" #指定配置檔案
--web.listen-address="0.0.0.0:9090" #監聽埠
--web.max-connections=512 #預設最大連線數512
--storage.tsdb.path="data/" #預設的儲存路徑: data目錄下
--alertmanager.timeout=10s #把報警傳送給alertmanager的超時限制10s
--query.timeout=2m #查詢超時時間限制預設為2min,超過自動被kill掉。可以結合grafana的限時配置如60s
--query.max-concurrency=20 #併發查詢數prometheus的預設採集指標中有一項prometheus_engine_queries_concurrent_max可以拿到最大查詢併發數及查詢情況
2、配置檔案解析
[root@localhost ~]# cat /usr/local/prometheus/prometheus.yml
global:
#預設情況下專區目標的頻率
[ scrape_interval: | default = 1m ]
#抓取超時時間
[ scrape_timeout: | default = 10s ]
#評估規則的頻率
[ evaluation_interval: | default = 1m ]
#與外部系統通訊時新增到任何時間序列或警報的標籤
#(聯合,遠端儲存,alertma# nager)
external_labels:
[ : ... ]
#規則檔案指定了乙個globs列表
#從所有匹配的檔案中讀取規則和警報
rule_files:
[ - ... ]
#抓取配置列表:
scrape_configs:
[ - ... ]
#警報指定與alertmanager相關的設定
alerting:
alert_relabel_configs:
[ - ... ]
alertmanagers:
[ - ... ]
#與原創寫入功能相關的設定
remote_write:
[ - ... ]
#與原創讀取功能相關的設定
remote_read:
[ - ... ]
3、配置:
部分指定一組描述如何刮除他們的目標和引數。在一般情況下,乙個scrape配置指定單個作業。在高階配置中,這可能會改變。
目標可以通過引數靜態配置,也可以使用其中一種支援的服務發現機制動態發現。
其中在所有scrape配置中必須時唯一的。
4、靜態配置scrape_configs:
正常裡面我們使用經常配置檔案還是比較多的,在我們伺服器的數量不是很多的場景下,我們可以使用靜態的方式來進行配置,如下:
基礎資訊配置:
scrape_configs:
- job_name: 'linux-bj' #job名稱
static_configs: #靜態的形式
- targets: ['192.168.10.121'] #遠端位址
labels: #標籤
idc: bj-jiuxianqiao #機房標籤
- job_name: 'linux-gx'
static_configs:
- targets: ['192.168.10.121:9100']
labels:
idc: gz-daxuecheng
[root@localhost ~]# systemctl restart prometheus
web頁面檢視:
視覺化介面
alerts:表示可以看到我們定義的告警規則。
status:下面比較主要的式target,表示我們遠端的監控,可以看以下exporter的運**況,出現故障很容易看出來。
prometheus入門介紹
參考blog,入門以prometheus為中心的服務監控系統的運作流程,包括警告管理系統alertmanager 視覺化介面 push gateway 臨時任務和批處理任務的推送處理方式。prometheus官方文件 自動抓取資料到 自動報警 視覺化展示效果 prometheus是乙個開源的服務監控...
Prometheus簡介介紹
prometheus 簡介 隨著容器技術的迅速發展,kubernetes 已然成為大家追捧的容器集群管理系統。prometheus 作為生態圈 cloud native computing foundation 簡稱 cncf 中的重要一員,其活躍度僅次於 kubernetes,現已廣泛用於 kub...
prometheus函式介紹
gauge型別的資料 屬於隨機變化數值,並不像counter那樣 是 持續增長 increase 函式 在promethes中,是 來 針對counter 這種持續增 長的數值,擷取其中 段時間的增量 increase node cpu 1m 這樣 就獲取了 cpu總使 時間 在1分鐘內的增量,得到...