廣義的gpu利用是指對gpu利用率效率,包括gpu空間和時間上的利用效率。 狹義的gpu利用率是指gpu時間片上的利用率;
gpu可利用資源:sm (計算單元)mem(儲存) encoder(編碼) decoder (解碼)
gpu資源利用不高的原因大致如下:
cpu計算阻塞了gpu的計算
應用程式大多數解決業務問題,但是忽略了對gpu利用方面的問題。程式需要優化,比如使用多stream,大多數業務只用了default stream。
對nvidia產品了解不深入,比如dali。一些gpu資源encoder和decoder 沒用起來。
1、在需要監控gpu利用率機器上執行命令:
nvidia-smi --format=csv,noheader,nounits --query-gpu=timestamp,index,memory.total,memory.used,memory.free,utilization.gpu,utilization.memory -lms 500 -f smi-1-90s-instance.log
該命令生成gpu利用率檔案smi-1-90s-instance.log
待壓測結束後,在伺服器結束該命令。
2、計算gpu利用率
cat smi-1-90s-instance.log | awk 'end'
計算檔案中gpu利用率一列平均值,即為壓測時間段內的gpu利用率
單個gpu,比如計算gpu0的利用率
awk -f"," ' } ' smi-1-90s-instance.log >> test.log
先導出gpu0的全部資料
再cat smi-1-90s-instance.log | awk 'end'
cpu利用率 CPU利用率錯誤
cpu利用率 cpu利用率是每個人用來衡量處理器效能的指標。netflix的高階效能架構師布倫丹 格雷格 brendan gregg 在第16屆年度南加州linux expo scale 上稱其為 五分鐘公共服務公告 但 cpu卻是一種誤導性的衡量指標,說明處理器的實際繁忙程度。布倫丹在他的閃電演講...
記憶體利用率
記憶體利用率 有多個命令提供有關系統記憶體利用率的相關資訊。最流行的是free 和pmap。free命令 free 命令顯示可用的物理記憶體量,其中包括總物理記憶體量 已用物理記憶體量 可用物理記憶體量。它也為交換空間顯示同樣的統計資訊,還顯示核心使用的記憶體快取大小和緩衝區的大小。圖7 5 顯示了...
WLAN通道利用率
wlan空口 通道利用率監控大致如下 引數 說明 ctl channel 主通道號 channel band 通道頻寬 ext channel 11n 產品支援 輔通道型別 bellow above bellow 輔通道向下繫結 above 輔通道向上繫結 ctlbusy 主通道利用率 txbusy...