對集群健康狀況、使用主題、消費組資源的巡檢,發現達到閾值則傳送告警資訊給管理員或者資源申請者。監控是告警的基礎,告警的巡檢基於前面兩篇文章中監控採集到的資料。
告警的重要性不必過多地贅述,rocketmq 集群往往承載著公司核心業務流轉。如果集群不可用往往影響是全公司的業務,事故責任是公司最高端別的。
本文從告警項的設計、告警流程、告警實戰給出指導建議,在實踐中以此為思路擴充套件完善,實現自己公司的定製化告警。
下圖分別從主題、消費組、集群維度羅列了比較重要的告警項以及觸發條件包括哪些方面。
觸發條件
主題告警
傳送速度:當傳送速度滿足觸發條件設定的閾值時傳送告警資訊。
例如:5
RocketMQ 集群效能摸高
我們在生產環境搭建乙個集群時,需要對該集群的效能進行摸高。即 集群的最大 tps 大約多少,我們做到心裡有數。通常我們日常的實際流量控制在壓測最高值的 1 3 到 1 2 左右,預留一倍到兩倍的空間應對流量的突增情況。如何進行壓力測試呢?寫段傳送 測試同學通過 jmeter 進行壓力測試,或者 中通...
RocketMQ 廣播消費模式與集群消費模式
rocketmq有兩種消費模式 broadcasting廣播模式,clustering集群模式,預設的是 集群消費模式。廣播消費指的是 一條訊息被多個consumer消費,即使這些consumer屬於同乙個consumergroup,訊息也會被consumergroup中的每個consumer都消費...
RocketMQ集群架構與原理解析
rocketmq是一款分布式 佇列模型的訊息中介軟體,由阿里巴巴自主研發的一款適用於高併發 高可靠性 海量資料場景的訊息中介軟體。早期開源2.x版本名為metaq 15年迭代3.x版本,更名為rocketmq,16年開始貢獻到apache,經過1年多的孵化,最終成為apache頂級的開源專案,更新非...