科學計算顯示卡的幾個主要效能指標:
1、運算能力:flops 每秒浮點運算次數,tflops表示每秒萬億(10^12)次浮點計算;
2、計算效能:
3、視訊記憶體大小:視訊記憶體大小也決定了實驗中能夠使用的樣本數量和模型複雜度。
4. cuda 核心數量
1、cuda compute capability對比(computer capability 並不代表顯示卡的計算能力,主版本號說明gpu的架構,副版本號相當於更新的版本)
gtx titan x :5.2
gtx 980 :5.2
tesla p100 :
tesla k80 :3.7
tesla k40 :3.5
k4200 : 3.0
2、計算效能(tflops) 比較
單精度single 雙精度double
gtx titan x : 7 0.2
gtx 980 : 4.6 0.15
tesla p100 : 10.6 5.3
tesla k80 : 8.73 2.91
tesla k40 : 4.29 1.43
k4200 : 2.0
單精度能夠保證小數點後6到7位計算準確(2^23),雙精度則是14到15位(2^52)
3、視訊記憶體大小
gtx titan x :12gb
gtx 980 :4gb
tesla p100 : 16g
tesla k80 :24gb
tesla k40 :12gb
k4200 :4gb
4. cuda 核心數量
gtx titan x
gtx 980
tesla p100 : 3584
tesla k80 : 4992
tesla k40 : 2880
k4200
5、**比較(網上**京東****)
gtx titan x :8000+-
gtx 980 :6000+-
tesla p100 : 45000++
tesla k80 :33000+-
tesla k40 :25000+-
k4200 :6000+-
1、gtx 系列顯示卡優缺點:
優點:單精度計算能力強大,視訊記憶體最大12gb,價效比高
缺點:雙精度計算能力弱,沒有計算糾錯ecc 記憶體,對於超高精度計算不利
2、tesla 或 quadro顯示卡優缺點:
優點:雙精度計算能力最強,擁有ecc記憶體增強計算準確率,
缺點:單精度計算能力差,**較高
總結:單從效能上選擇,tesla k80是最強大的,但也最貴;綜合價效比來考慮 gtx titan x 最好。
各系列顯示卡效能引數對比
當前比較流行的顯示卡引數對比彙總,如下圖所示 geforce cuda核心數 頻率視訊記憶體 其它年份 參考 geforce mx150 3841469mhz 2g筆記本顯示卡 gtx 1660 1408 1785mhz 6ggpu架構turing 功耗120w 2012 1700 gtx 1660...
智慧型AI計算晶元對比
下面是本人接觸到的ai晶元,主要涉及華為 位元大陸 算豐 英偉達。其他還有寒武紀 地平線 瑞芯微等沒有接觸過就不對比了。易開發性 位元大陸 英偉達 華為 效能 華為 英偉達 位元大陸 效能不是很好對比,每家實現的運算元效能有差異,不能單純對比tops 算力記憶體 頻寬 gb s 解碼編碼 功耗備註 ...
平行計算效率對比
qt include openmp include tbb include ppl include 測試各種並行運算方式的執行效率 openmp使用教程 tbb使用教程 tbb ppl基本用法 qtconcurrent使用教程 class point float x float y float z ...