aix系統日常巡檢步驟
aix系統日常巡檢主要包括以下幾個內容為:cpu
使用情況,記憶體使用情況,磁碟使用情況,系統錯誤日誌等。
通常執行以下幾個步驟來進行日常巡檢 1
、topas
主要監控資訊及監控指標
cpu監控指標:使用率60%
以下為宜,60-80%
需要進一步監控,90%
為資源緊張。wait
超過30%
時檢查磁碟使用情況。
磁碟監控指標:使用率30%
以下為好,30%-70%
為忙,長時間70%
以上,則可能存在磁碟瓶頸,需要進一步觀察
記憶體監控情況:記憶體主要看comp
使用率,如果長時間超過90%
,需要進一步觀察頁面空間使用情況
頁面空間監控情況:使用率超過70%
,則需要考慮新增記憶體。 2
、iostat
命令主要監控資訊及監控指標
%tm_act
:30%
以下為好,30%-70%
為忙,長時間70%
以上,則可能存在磁碟瓶頸
%idle
:cpu
空閒時間,低於10%
則cpu
比較忙。
% iowait
: cpu
等待磁碟 i/o
請求的時間,超過35%
,則可能存在磁碟io
瓶頸 3
、vmstat
主要監控資訊及監控指標 r
列:觀察該列資料是否大於cpu
數,如果長時間大於cpu
數,則可能對效能有影響。 b
列:被阻塞列執行緒數目,如果長時間大於2
,則影響效能。
us+sy
:us+sy>70%
,則可能存在cpu
資源不足
free
:記憶體空閒列表,該值與minfree
比較,低於minfree
,則進一步觀察pi
,po值
pi :從調頁空間調入的頁數。大於5
說明記憶體不足 po
:調出到調頁空間的頁面數。
free,pi
,po相結合觀察,如果
free
低於minfree
,並且po、pi
持續增長
,則代表出現了
系統顛簸,
4、lsps –a
或者swap –l
lsps
觀察%used
,不超過70%
為宜swap
觀察free
5 、df –g
主要監控資訊及監控指標
%used
:磁碟空間使用率,關鍵系統的磁碟使用率不高於80%
%iused
:inode
使用率,關鍵系統的磁碟使用率不高於80% 6
、errpt |more
檢視系統錯誤日誌
#errpt -d h
列出所有硬體出錯資訊
#errpt -d s
列出所有軟體出錯資訊
#errpt -aj error_id
列出詳細出錯資訊
7 、mail
或者tail -200 /usr/spool/mail/root
檢視系統郵件通知 8
、檢查機器報警燈及led
**。故障解決後可以通過下面命令關閉報警燈
# /usr/lpp/diagnostics/bin/usysfault -s normal或者執行diag也可以關閉報警燈。
9、如果系統重啟過,執行 alog –t boot –o檢視啟動過程中有無異常
日常巡檢 指令碼
bin bash function system os time date f t os run time uptime awk awk f,os last reboot time who b awk os hostname hostname echo 系統型別 os type echo 系統版本 ...
企業日常巡檢
centos6版本的,我這個指令碼名字 checkeveryday.sh 先將系統時間與網路時間同步 linux的時間分為system clock 系統時間 和real time clock 硬體時間,簡稱rtc 檢視系統時間的命令 date 設定系統時間的命令 date set 月 日 年 時 分...
企業日常巡檢
root izbp176gmws1f6cpbllwouz vim check.sh bin bash function system os time date f t os run time uptime awk awk f,os last reboot time who b awk os host...