記一次排查fio順序寫測試IOPS上不去的問題

測試命令：

fio -name=iops -filename=/root/testfio -ioengine=libaio -direct=1 -bs=4k -size=4g -runtime=60 -numjobs=2 -thread -rw=write -group_reporting -time_based

兩台同配置伺服器，同樣的測試命令，iops相差近40倍：

a伺服器平均iops=1000+：

b伺服器平均iops=40000+；

在a伺服器上用blktrace分析，發現a的d2c最大耗時902ms，極為不正常；b的d2c耗時最大為40ms，比較正常：

懷疑a伺服器raid卡或磁碟有異常，導致d2c耗時較高。檢視a，b伺服器raid卡，磁碟資訊，發現a伺服器raid卡的flash、超級電容均不在位，所以懷疑a伺服器因此導致了raid卡的write cache功能是關閉的：

經確認確實如此，a是關閉的，b是開啟的：

./sotrcli64 /c0 show all

a: rwtd //wt=write through, d=direct io(讀方向)

b: rwbd //wb=write back, d=direct io(讀方向)

將a的raid卡write back開啟（./storcli64 /c0 set wcache=awb），fio測試iops恢復與b一致, 其實最終還是需要替換a的raid卡為flash、超級電容在位的raid卡，這樣開啟write cache功能才能保證掉電安全。

記一次排查fio順序寫測試IOPS上不去的問題

記一次線上問題排查

記一次前端bug排查

記一次xxljob異常排查

記一次排查fio順序寫測試IOPS上不去的問題

記一次線上問題排查

記一次前端bug排查

記一次xxljob異常排查

相關推薦