線上故障排查之應用系統反應變慢

top命令

vmstat命令

free命令

df命令

iostat命令

ifstat命令

應用系統變慢，可能有多個原因，一般我們用以下幾個命令來排查原因：

整體情況 top

cpu vmstat

記憶體 free

硬碟 df

磁碟io iostat

網路io ifstat

通常我們會先用top命令看一下整機的情況：

通常我們看三個引數值：

在top命令下連續按1，可以顯示具體的cpu列表

top命令有乙個精簡版命令：uptime

我們通常用vmstat檢視cpu和記憶體情況，如下圖：

下面對輸出的每一列做一下簡單介紹：

-procs

-cpu

直接使用vmstat命令，只輸出一行資訊，我們可以用以下命令，來取樣檢視：

vmstat -n 2  10

意思是：每個2秒採集一次，共採集10次

檢視所有cpu核資訊：mpstat -p all 2，每兩秒取樣一次，列印出所有cpu核資訊

檢視每個程序使用cpu的用量分解資訊 pidstat -u -1 -p 程序編號

我們通常用free檢視系統的記憶體，free表示按照位元組顯示，free -g 表示按照gb顯示記憶體，free -m 表示按照mb顯示記憶體。

-經驗值：

檢視記憶體額外資訊：

pidstat -p 程序號 -r 取樣間隔秒數

現在服務基本都是部署在雲上，磁碟容量管夠，但是我們還是要知道怎麼檢視磁碟的使用情況。

df：以位元組的形式顯示用量，剩餘量等資訊。

df -h：以正常人能看得懂的方式顯示用量，剩餘量等資訊。

大表批量存大批量的資料時，長時間的io會對效能造成很大的影響，通常我們用

iostat -xdk 2 3來檢視磁碟io的情況。2表示時間間隔2秒，3表示取樣次數。

檢視額外資訊，可以使用

pidstat -d 取樣間隔秒數 -p 程序號

來檢視。

網路io有時也是造成效能瓶頸的主要原因，我們可以通過ifstat檢視網路io的情況。

線上故障排查（2019 12 02）

背景介紹一背景介紹二排查過程服務列表服務名稱介紹ms crf 主應用ms base org 使用者服務 ms hrpaccoint 賬號服務主應用ms crf專案新增使用者報錯，經過查詢服務日誌是呼叫ms base org使用者服務時候報系統錯誤查詢ms base org服務日誌...

一次線上tomcat OOM故障排查

公司的一組tomcat集群最近隔段時間出現oom故障的問題，間隔時間以及發生故障的tomcat也是隨機的，一時定位不到問題發生oom時使用 jmap dump file 檔名.dump pid 一直無法dump出堆記憶體，於是給所有tomcat啟動指令碼配置引數，發生oom時匯出堆記憶體快照。x...

系統故障排查

一 1.建立用於儲存mbr備份的新硬碟分割槽,並永久掛載 1 新建乙個目錄 mkdir backmbr 2 掛載 mount dev sdd1 backmbr 永久掛載 vim etc fstab 3 備份mbr扇區資料 dd if dev sda of backmbr mbr.bak bs 512...

線上故障排查之應用系統反應變慢

線上故障排查（2019 12 02）

一次線上tomcat OOM故障排查

系統故障排查

相關推薦