最近自己做了乙個監控,對公司所有主機、資料庫進行簡單的監控,具體包括主機記憶體剩餘量、磁碟使用率,程序監控等,
1、相應主機記憶體剩餘多少進行監控,可以定製乙個閥值,如果低於這個閥值就報警,如1g,下面紅框內是要監控的值
普通 linux機器,是用free -m命令,顯示如下:
ibm機器,使用vmstat命令,顯示如下:
hp機器,使用top -w -d 1命令,顯示如下:
2、磁碟分割槽使用率(bdfusedpercentproperties),可以定製乙個閥值,如果低於這個閥值就報警,如85%
普通 linux和ibm機器都是使用df命令,顯示如下:
hp機器使用bdf命令,顯示如下:
3、檢視開啟的檔案控制代碼數,
如果作業系統最大開啟數沒有限制,當開啟數大於3000報警
如果作業系統最大開啟數有限制,當開啟數大於最大限制數/5
普通linux機器使用/usr/sbin/lsof |wc -l;ulimit -n,前乙個命令是當前開啟數,後乙個命令是最大開啟數
ibm機器使用lsof |wc -l;ulimit -n命令,hp機器使用/usr/sbin/kcusage -t maxfiles_lim命令
4、監控程序是否啟動,如果沒有啟動就報警,
oracle資料庫是否啟動:ps -ef|grep tnslsnr
tomcat程序是否啟動:ps -ef|grep tomcat
5、監控表資料庫分割槽、表空間等
監控是否預建表分割槽,sql語句如下:
只需監控extra_part是否小於預設的閥值
表空間剩餘量,sql語句如下:
只需監控pct_free是否小於預設的閥值?
6、監控tomcat日誌和oracle日誌是否包含指定的字元,如「error」、「ora」 ,如:
grep -i 'error' log.log |tail -1
7、監控資料庫的連線數,sql語句如下:
select count(*) cou from v$session where username is not null
Shell之批量監控主機磁碟使用率
1 本地磁碟監控 use rate list df h awk dev 結果 dev sda1 10 for use rate in use rate list do part name use rate if use rate ge 80 then echo warning part name p...
5 監控磁碟使用率
雖然對於磁碟的監控屬於最基礎的監控,但是很多時候往往因為疏忽而忽略監控磁碟,最終導致事故發生,磁碟監控還是需要重視起來。本案例就是要監控磁碟使用率。具體要求如下 1 每分鐘檢測一次磁碟狀況 2 當磁碟空間使用率或inode使用率高於90 需要發郵件告警,假設收件郵箱為admin admin.com ...
linux監控記憶體使用率
一 監控目的 通過監控記憶體使用率判定機器記憶體資源消耗情況,及時處理並優化資源配比。二 監控方法 1 監控命令 free m cat proc meminfo 2 監控指標 記憶體使用率 buffer cache 3 監控方法 通過上述命令對記憶體總量 使用量進行擷取,取得記憶體使用率,並根據閾值...