#設定監控的最大佇列數,當postfix佇列數超過設定警戒值自動傳送告警郵件給相關運維管理人員
#!/bin/bash
#佇列目錄
queue_dir_naes="/incoming/ \
/active/ \
/bounce/ \
/defer/ \
/deferred/ \
/corrupt/ \
/hold/ \
/trace/"
admin="[email protected] \
#最大警戒值
maxnum=400
#日誌log="/var/log/monitor_queue.log"
#主機ip
local_ip=$(ifconfig |grep "inet addr"| head -n 1 | cut -f 2 -d ":"|cut -f 1 -d " ")
echo_red()
echo_yellow()
send_mail()
echo "############### start mon queue [$(date +"%y-%m-%d %h:%m:%s")] ############### " >> $log
while :
do for dir_name in $queue_dir_naes
docount=$(find /var/podo/postfix/spool/ -type f | grep $dir_name | wc -l)
mark=`cat .queue_mark`
if [ $count -gt $maxnum ] && [ $mark = 1 ]
then
export lang="zh_cn"
dir2queue=$
queue_name=$
echo_yellow "[$(date +"%y-%m-%d %h:%m:%s")] queue number has exceeded the set warning value:">> $log
echo_red "$queue_name queue num $count. " >> $log
echo "" >> $log
send_mail $queue_name $count
fi done
echo 0 > .queue_mark
sleep 600
echo "############### poll mon queue [$(date +"%y-%m-%d %h:%m:%s")] ############### " >> $log
done
監控告警優化需求的思考
目前主要負責監控告警,屬於運維開發的範疇。公司有三個以上核心專案,應用服務人數超過萬人。運維人員40人左右,總專案幾百個,資源分配不均。只能集中力量辦大事。昨天看到一篇文章,客戶和使用者的區別,當然產品是面向to c的,但是我認為所有的概念都是可以相互轉換的。客戶其實是可以對產品好壞進行評價,具有拍...
prometheus監控告警終極玩法包教包會的那種
倉庫中包含四個資料夾,分別介紹如下 prometheus prometheus的安裝與相關配置檔案。alert 告警的安裝與相關配置檔案。kube state metrics k8s提供的metrics,不是必須安裝的,僅在用到的情況下安裝即可。rules targets 需要持久化的檔案,包括ru...
配置raid5監控告警
採用megacli sendmail方式 一 背景 伺服器建立了raid5陣列,但是硬碟執行狀態與健康情況無法實時獲取.通過查詢各種解決方案,決定採用megacli sendmail的方式定時獲取磁碟相關資訊 二.伺服器環境與需要安裝的工具 專案詳情 伺服器型號 dell r430 硬碟型別 nas...