關於深度學習的nvidia的gpu加速網路訓練引數效能測試
英偉達rtx 30系列已出,有預算的,建議直接30系列了
深度學習注重的引數有兩個,分別是視訊記憶體頻寬和單精度浮點計算能力(這裡不考慮雙精度浮點計算能力)
視訊記憶體頻寬計算涉及到的顯示卡引數:視訊記憶體位寬(位)、視訊記憶體頻率(mhz)
單精度浮點據算能力涉及到的顯示卡引數:顯示卡主頻(mhz)、cuda核心
下面介紹常見的幾種顯示卡引數:
顯示卡型號
視訊記憶體單精度計算能力
視訊記憶體頻寬
主頻xcuda核心數x2/1000 (tflops)
視訊記憶體位寬x視訊記憶體頻率/8/1000(gb/s)
1060
6g1.582x1280x2=4.05
192.2
1660ti
6g1.580x1536x2=4.85
2881070
8g1.566x1920x2=5.78
256.32
1070ti
8g1.607x2432x2=7.85
2561080
8g1.607x2560x2=8.23
3201080ti
11g1.480x3584x2=10.61
484.4
2060
8g1.365x1920x2=5.24
3362070
8g1.410x2304x2=6.51
4482070 super
8g1.410x2560x2=7.22
4482080
8g1.515x2944x2=8.92
4482080 super
8g1.650x3072x2=11.65
4482080ti
11g1.350x4352x2=11.75
6163070
8g1.730x5888x2=20.40
4483080
10g1.71x8704x2=29.80
7603090
24g1.70x10496x2=35.70
936titan x (maxwell架構)
12g1.000x3072x2=6.14
336.6
titan x (pacsal架構)
12g1.418x3584x2=10.16
336.58
titan xp
>12g
1.582x3840x2=12.15
547.7
titan v
>12g
1.200x5120x2=15.36
652.8
執行相同的**所用時間對比,並不能完全依照上述單精度計算能力來對比速度
顯示卡型號
單精度計算力
測試結果
1080ti
10.61
165s
2070
6.51
194s
3070
20.40
154s
AI開發 深度學習如何選擇GPU?
機器推理在深度學習的影響下,準確性越來越高 速度越來越快。深度學習對人工智慧行業發展的貢獻巨大,這得益於現階段硬體計算能力的提公升 網際網路海量訓練資料的出現。本篇文章主要介紹深度學習過程中如何選擇合適的gpu顯示卡,如果你是深度學習新手,希望這篇文章對你有幫助。推理用到的硬體分兩種,一種是專業ai...
深度學習之選擇GPU或CPU方法
import os os.environ cuda device order pci bus id os.environ cuda visible devices 1 上邊表示使用第二塊gpu執行程式,如果要使用多塊,如第一塊和第三塊,可使用如下方法指定 os.environ cuda visibl...
深度學習GPU執行環境的檢視和設定
使用nvidia smi來查詢gpu資訊 nvidia smi是乙個命令列工具,可以幫助你管理操作gpu device,並且允許你查詢和更改device狀態。在windows命令提示符中輸入cd c program files nvidia corporation nvsmi,再輸入nvidia s...