最近總結了一下之前使用zabbix的一些心得體會與大家分享,本文省略安裝和環境搭建,專注zabbix的配置使用,重點是自定義鍵值規則。博主當時接到監控gpu的任務,因為gpu沒有現成的鍵值對,因此需要自定義,心疼的抱抱自己。。
步驟
新增監控主機
自定義模板
自定義鍵值
新增監控項
可以自己建立新的監控主機,也可以通過配置自動發現新增。
在有多個監控指標使用相同的方法配置時,可以建立監控模板。
名稱
自定義,群組
根據需要選擇,主機/模板
選擇要使用模板的主機(也可以之後通過主機鏈結模板)。
有時zabbix裡現成的鍵值沒有我們需要的,這時就要自定義了。
配置環境
在要檢測的主機上執行$ cd /etc/zabbix
,可以看到zabbix_agentd.conf
和zabbix_agentd.conf.d
兩個檔案,先開啟zabbix_agentd.conf
,設定 server 和 serveractive 為安裝監控端zabbix的主機ip,如果在本機就是127.0.0.1。再檢查一下include=/etc/zabbix/zabbix_agentd.conf.d/*.conf
前面的#
是否已經去掉。
如果需要zabbix自動註冊主機,則還需將hostnameitem=system.hostname
前的#
去掉,並且設定hostmetadata = uat(乙個加入群組的條件)
。
編寫自定義指令碼
在/etc/zabbix
資料夾下新建乙個shell指令碼,對指令碼進行測試,看是否可以提取所需的資料。
儲存並chmod 755
,這時ls
可以看到檔案變成了綠色。
說明:這裡的 monitoring.txt 是 monitoring.sh 指令碼執行生成的檔案,是我需要監控的一些指標,一共8個gpu的指標。此處1對應的是編號0 的gpu。
編寫鍵值規則
執行$ cd zabbix_agentd.conf.d
,在該資料夾下新建乙個xx.conf
檔案,固定格式為userparameter=,
。
重啟zabbix-agent (很重要)
儲存好xx.conf
檔案後,一定要重啟zabbix-agent。
$ systemctl restart zabbix-agent
這時我們就已經新定義了乙個鍵值。
當我們定義好鍵值後,就可以在模板裡新增監控項了。因為是自定義的鍵值,所以需要手動輸入,在裡更改引數即可。
需要注意的是zabbix對速度要求很高,如果你寫的指令碼執行速度慢,則可能會報timeout的錯誤。如果遇到這種錯誤,可以嘗試將監控資料提前執行出來重定向到臨時檔案裡,再複製到指定檔案 (不直接重定向到指定檔案是為了防止重新整理資料時中間出現的空白文檔期導致異常),之後從檔案裡直接讀取資料會快很多。
如果用了1所述方法,則需要將提取資料的指令碼做定時任務,和zabbix重新整理資料同步,但由於cron最小間隔只有1分鐘,如果要求頻率在1分鐘以內,則需要在指令碼中使用sleep。例如:每30s取一次資料,讓指令碼sleep 30之後再執行一遍**,然後放到crontab中定時即可。
學習心得 python學習心得
自從來了深圳工作以後,尤其是屢屢面試碰壁以後。發現其實自己的知識面很窄,做筆試題的時候絞盡腦汁還是漏洞百出,並不是不會做,而是出現一大堆不該有的失誤。每次被問道,對資料庫了解嗎?說一大堆看起來很高階的東西 好啊,那我們寫幾個sql語句吧。馬上完蛋了,沒了手冊關鍵字都記不起。了解哪幾種指令碼語言,sh...
學習心得 我的學習心得
我是乙個已經步入中年的70後,離開校園已經20年了,因為當年的政策因素而未能圓我的大學夢,在20年的工作過程中總是因為缺少一張大學文憑而失去了很多機會,曾經也考慮過自考,但是乙個人去面對的時候總感覺心有餘而力不足。2018年3月份偶然讓我認識了尚德,原來自考還可以這樣學習。一直懷疑自己年紀大了記憶力...
Spring學習心得
不看不知道,一看便學到,會不會與您產生共鳴呢?喜歡再捧場拍磚 spring使用從一年前開始,邊學習邊開發。這裡講講我的學習心得。第一條 記住ioc就是spring的一切。而掌握ioc的唯一方法就是使用和思考。spring是ioc為核心的,所以第一步就是要深刻理解ioc,最好是能盡快把ioc作為教條式...