Prometheus 編寫告警規則案例

2022-05-17 06:31:21 字數 1214 閱讀 7288

prometheus 編寫告警規則案例

:確保alertmanager配置完畢!

#

groups:組告警

groups:

#name:組名。報警規則組名稱

-name: general.rules #

rules:定義角色

rules: #

alert:告警名稱。 任何例項5分鐘內無法訪問發出告警

-alert: nodefilesystemusage

#expr:表示式。 獲取磁碟使用率 大於百分之80 觸發

expr: 100 - (node_filesystem_free_bytes / node_filesystem_size_bytes * 100) > 80

#for:持續時間。 表示持續一分鐘獲取不到資訊,則觸發報警。0表示不使用持續時間

for: 1m

#labels:定義當前告警規則級別

labels:

#severity: 指定告警級別。

severity: warning

#annotations: 注釋 告警通知

annotations:

#呼叫標籤具體指附加通知資訊

summary: "

instance } :} 分割槽使用率過高"#

自定義摘要

description: "

} : } :} 這個分割槽使用大於百分之80% (當前值:})"#

自定義具體描述

./promtool check config prometheus.yml

kill -hup 11853

3、控制台檢視配置

:可以配置多個監控需要配置配置檔案配置多個 -alert:。

Prometheus告警收斂

告警面臨的最大問題 就是告警訊息太多,很可能會導致運維人員遺漏重要的告警資訊,或者一些無關緊要的小警報太多,收件人很容易麻木,可能不再理會。如果遺漏關鍵警報沒有及時處理可能會對系統業務造成重大故障。在這個問題上,alertmanager的告警收斂配置就變得尤為重要了。合理的分組將類似的警報進行分類。...

Prometheus 告警收斂

prometheus 告警收斂 告警面臨最大問題,是警報太多,相當於狼來了的形式。收件人很容易麻木,不再繼續理會。關鍵的告警常常被淹沒。在一問題中,alertmanger在一定程度上得到很好解決。prometheus成功的把一條告警發給了altermanager,而altermanager並不是簡簡...

Prometheus告警簡介

告警能力在prometheus的架構中被劃分成兩個獨立的部分。如下所示,通過在prometheus中定義alertrule 告警規則 prometheus會週期性的對告警規則進行計算,如果滿足告警觸發條件就會向alertmanager傳送告警資訊。在prometheus中一條告警規則主要由以下幾部分...