在使用gpu進行深度學習實驗,了解gpu的狀態非常重要
1、nvidia-smi
顯示gpu當前的狀態和屬性
gpu :gpu 編號;
name :gpu 型號;
persistence-m :持續模式的狀態。持續模式雖然耗能大,但是在新的gpu應用啟動時,花費的時間更少,這裡顯示的是off的狀態;
fan :風扇轉速,從0到100%之間變動,n/a表示沒有風扇;
temp :溫度,單位是攝氏度;
perf :效能狀態,從p0到p12,p0表示最大效能,p12表示最小效能(即 gpu 未工作時為p0,達到最大工作限度時為p12)。
pwr:usage/cap:能耗;
memory usage :視訊記憶體使用率;
bus-id :涉及gpu匯流排的東西,domain:bus:device.function;
disp.a :display active,表示gpu的顯示是否初始化;
volatile gpu-util:浮動的gpu利用率;
uncorr. ecc :error correcting code,錯誤檢查與糾正;
compute m :compute mode,計算模式。
下面的processes是正在執行的程式程序情況
2、指定gpu執行程式
cuda_visible_devices=裝置編號 python main.py
在某個指定裝置編號下執行程式,或者直接寫到程式中
os.environ["cuda_device_order"]="pci_bus_id" #按照pci_bus_id順序從0開始排列gpu裝置
os.environ["cuda_visible_devices"]="0" #設定當前使用的gpu裝置僅為0號裝置 裝置名稱為 『/gpu:0』
這樣的表達更為靈活
參考:
1、
離線安裝tensorflow gpu
前言 安裝前先確定電腦可以使用gpu執行tensorflow,否則浪費時間。nvidia 英偉達 官網官網檢視顯示卡是否支援gpu執行,compute capability需要在3.0及以上,否則安裝後,不能用gpu執行程式,會自動呼叫cpu執行。nvidia官網 密碼 0pmq 檔案列表 anac...
Tensorflow gpu版本安裝
這裡安裝想要嘗試最新的cuda10.1,但是失敗了,得到的教訓就是要嚴格的按照官方的版本要求。因為tensorflow1.13是基於cuda10的並沒有整合10.1,個人推測,兩家是不同的公司cuda10.1正常不會想到要相容自己的上層應用,或者s是tf直接寫死的需要cuda10。不管怎樣,現在總結...
TensorFlow GPU環境搭建
你們可能看不懂,因為主要是為了自己看 笑哭 顯示卡product gp104 geforce gtx 1080 10de 1b80 版本 ubantu 18.04 anaconda3 nvidia 930 cuda 91 cudnn 7.04 tensorflow gpu 1.13.1 一 uban...