nvidia-smi是 nvidia 顯示卡命令列管理套件,基於 nvml 庫,旨在管理和監控 nvidia gpu 裝置。
nvidia-smi 的輸出
這是 nvidia-smi 命令的輸出,其中最重要的兩個指標:
視訊記憶體占用
gpu 利用率
視訊記憶體占用和 gpu 利用率是兩個不一樣的東西,顯示卡是由 gpu 計算單元和視訊記憶體等組成的,視訊記憶體和 gpu 的關係有點類似於記憶體和 cpu 的關係。
這裡推薦乙個好用的小工具:gpustat, 直接pip install gpustat
即可安裝,gpustat 基於nvidia-smi,可以提供更美觀簡潔的展示,結合 watch 命令,可以動態實時監控 gpu 的使用情況。
watch --color -n1 gpustat -cpu
gpustat 輸出
視訊記憶體可以看成是空間,類似於記憶體。
視訊記憶體用於存放模型,資料
視訊記憶體越大,所能執行的網路也就越大
gpu 計算單元類似於 cpu 中的核,用來進行數值計算。衡量計算量的單位是 flop: the number of floating-point multiplication-adds,浮點數先乘後加算乙個 flop。計算能力越強大,速度越快。衡量計算能力的單位是 flops: 每秒能執行的 flop 數量
1*2+3 1 flop1*2 + 3*4 + 4*5 3 flop
HystirixDashboard服務監控
一 建pom org.springframework.cloud groupid spring cloud starter netflix hystrix dashboard artifactid dependency org.springframework.boot groupid spring ...
sysdig linux sysdig系統監控神器
sysdig介紹 當需要追蹤某個程序產生和接收的系統呼叫時,你可能會想到strace。你會使用什麼樣的命令列工具來監控原始網路通訊呢?如果你想到了tcpdump。而如果你碰到必須追蹤開啟的檔案的需求,可能你會使用lsof。strace tcpdump和lsof確實是必備的工具,而這也正是你為什麼應該...
grafana prometheus搭建監控系統
1.簡介 本文是基於linux centos7搭建 關於grafana的安裝,網上有很多 在 etc yum.repos.d grafana.repo配置原始檔 如果熟悉docker的同學,那就很方便了,完全不用這麼麻煩了 安裝其實很簡單 安裝完成後 systemctl start grafana ...