下面是本人接觸到的ai晶元,主要涉及華為、位元大陸-算豐、英偉達。其他還有寒武紀、地平線、瑞芯微等沒有接觸過就不對比了。
易開發性:位元大陸》英偉達》華為
效能:華為》英偉達》位元大陸(效能不是很好對比,每家實現的運算元效能有差異,不能單純對比tops)
算力記憶體
頻寬(gb/s)
解碼編碼
功耗備註
公升騰310
16tops int8
lpddr4x 8/4gb
h.264/h.265 16路1080p@30fpsjpeg 1080p@256fps
1路1080p@30fps
9.5w
caffe/tensorflow
atlas300
4x4tflops62tops@int8
lpddr4x 4x 8gb
h.264/h.265 4x 16路1080p@30fpsjpeg 4x 1080p@256fps
4路1080p@30fps
67whi3559a
4tops@int8-nnie+2tops@int8-dsp
lpddr4x 4gb
5w算豐bm1880終端晶元
1tops@int8(winograd算計可達2tops@int8)
lpddr4 最大4gb
2路1080p@30fpsfhd:1080p@75fps
2.5w
多框架支援caffe\onnx
算豐bm1682雲端晶元
3tflops
8路1080p@30fps
可堆疊多顆晶元
算豐sc1/sc1+
2tflops/4tflops
16/32gb
501顆bm1680/2顆
nvidia jetson tx2
1tflops4tops@int8
lpddr4x 8gb
d2d 35d2h/h2d 20
8路1080p@30fps
7.5w
實測bm1682 vs hi3559a(單nnie)網路有快有慢,並不是某個晶元一定快。
bm1682
hi3559a
yolov3_352x384
32.65ms
41.4ms12
4yolov3_288x320
19.31ms
33.74ms
61.17ms
mobilenetv2_288x320
3.16ms
mtcnn_16x56
0.246ms
0.193ms
cnn_48x168
0.649ms
3.75ms
算力的計算,AI晶元與其他晶元的區別
所謂的ai晶元,一般是指針對ai演算法的asic 專用晶元 傳統的cpu gpu都可以拿來執行ai演算法,但是速度慢,效能低,無法實際商用。比如,自動駕駛需要識別道路行人紅綠燈等狀況,但是如果是當前的cpu去算,那麼估計車翻到河裡了還沒發現前方是河,這是速度慢,時間就是生命。如果用gpu,的確速度要...
AI晶元 Google TPU分析
in datacenter performance analysis of a tensor processing unit tpu系列晶元已經廣泛應用於google的各種服務中,加速其神經網路運算,例如2015年alphago與李世石進行圍棋人機對戰中所用的就是tpu晶元。tpu1面向的是資料中心...
邊緣計算大熱 AI晶元站上風口
5g商用臨近,物聯網技術和產業鏈逐步成熟,邊緣計算有望成為下乙個風口。由於使用者的巨大計算需求和物聯網帶來的海量資料 邊緣計算的受歡迎程度在不斷提高。其中雲 ai技術和產業有深厚積累及前沿布局的平台型公司有望成為邊緣計算浪潮最大受益者。ai晶元或大放異彩。中國大陸目前有超 20 家企業投入 ai 晶...