從接觸和使用zabbix已經有2年多的時間,剛開始接觸也就是從zabbix安裝,使用和簡單的維護開始學習。到後來涉及到如何新增監控主機?如何自定義監控項?如何設定報警閥值?等開始學習。
有幸在2023年底從零開始研究和選型整個公司idc監控系統。由於zabbix簡單易用和強大功能,決定用zabbix做為公司的監控系統。整個公司有多個idc機房,監控節點有700左右,採用zabbix分布式來監控。
現在zabbix上線已經接近一年的時間,執行非常穩定,開啟頁面速率流暢。在這一年的多的時間裡面,也發表了一系列文章,主要包括zabbix監控和分布式部署和實施方案、zabbix如何監控網路裝置、zabbix 後台資料操作和api等。希望對廣大朋友所有幫助。
1)zabbix監控和分布式部署實施方案
2)zabbix分布式部署proxy實戰
3)zabbix如何監控網路裝置
4)zabbix如何監控windows機器
5)zabbix通過shell指令碼監控hp伺服器硬體資訊
6)zabbix通過snmp監控hp伺服器硬體資訊
7)通過zabbix全面監控netscaler負載均衡裝置
8)zabbix監控mysql資料庫效能
9)如何從zabbix資料庫中獲取監控資料
10)zabbix python api 應用實戰
做好監控系統,最重要的其實就是兩點,首先是監控專案的設定。根據系統、業務設定最能代表監控專案的效能指標。其次是報警閾值的設定。根據業務指標設定精準的報警閾值。比如說監控apache的httpd程序數監控,如果maxclients設定200,那麼當httpd程序在180的時候必須報警,如果在200的時候報警,此時由於httpd程序爆滿已經打不開頁面了或者開啟**的速度非常慢。
下面是平時工作中總結的zabbix報警閾值的設定,主要包括linux系統、windows系統、伺服器硬體監控、網路裝置和線路的監控的報警閾值的設定。
1)linux系統的報警閾值,這裡增加了linux殭屍程序的監控。
2)windows系統的報警閾值,perf_counter是通過windows的效能計數器獲取的資料。
3)sqlserver和iis的報警閾值,其中perf_counter是通過windows的效能計數器獲取的資料,check_iis_perf.sh是通過指令碼以external check方式監控的。
4)hp硬體的監控,主要是通過snmp協議和zabbix discovery方式來監控。
5)其它方面的監控,主要是應用程式的監控。
最後,發表此文章的主要目的是和廣大朋友相互交流和相互學習,在一些自定義監控專案上面提供更多一點自己的想法和使用經驗,如果在系統和應用的監控方面有更多好的想法,歡迎相互交流。
Zabbix分布式監控系統使用總結
從接觸和使用zabbix已經有2年多的時間,剛開始接觸也就是從zabbix安裝,使用和簡單的維護開始學習。到後來涉及到如何新增監控主機?如何自定義監控項?如何設定報警閥值?等開始學習。有幸在2013年底從零開始研究和選型整個公司idc監控系統。由於zabbix簡單易用和強大功能,決定用zabbix做...
zabbix 分布式監控proxy
概述 zabbix proxy 可以代替 zabbix server 收集效能和可用性資料,然後把資料匯報給 zabbix server,並且在一定程度上分擔了zabbix server 的壓力.此外,當所有agents和proxies報告給乙個zabbix server並且所有資料都集中收集時,使...
企業級分布式監控系統 zabbix
zabbix 是乙個企業級的分布式開源監控方案。zabbix重要的不是部署,而是學會操作使用,所以推薦大家進行一鍵部署。手動部署可參考官方文件 一鍵部署可參考 docker上一鍵部署 乙個監控系統執行的大概的流程是這樣的 zabbix agent需要安裝到被監控的主機上,它負責定期收集各項資料,併發...