Caffe原始碼學習3 CUDA程式設計

cuda（compute unified device architecture）的簡稱，是由nvidia公司創立的基於他們公司生產的圖形處理器gpus（graphics processing units,可以通俗的理解為顯示卡）的乙個平行計算平台和程式設計模型。

通過cuda，gpus可以很方便地被用來進行通用計算（有點像在cpu中進行的數值計算等等），相比於cpu，gpus的flops（float-point operations per second）是cpu的數倍。在沒有cuda之前，gpus一般只用來進行圖形渲染（如通過opengl，directx）。開發人員可以通過呼叫cuda的api，來進行並行程式設計，達到高效能計算目的。而且平行計算由大型集群擴充套件到了普通顯示卡，使得使用者只需要一台帶有geforce顯示卡的計算機就能執行較大規模的並行處理程式。

host 端是指在 cpu 上執行的部分，而 device 端則是gpu在上執行的部分。device 端的程式又稱為「kernel」。通常 host 端程式會將資料準備好後，複製到顯示卡的視訊記憶體中，再由顯示晶元執行 device 端程式，完成後再由 host 端程式將結果從視訊記憶體中取回。

測試**:test.cu

#include// 核函式宣告，前面的關鍵字__global__  
__global__ void kernel( void )  
int main(int argc, char* argv)  
nvcc -wno-deprecated-gpu-targets -arch sm_20 test.cu -o test

注意:

測試**:test.cu

#include int main( void ) {
cudaerror_t cudastatus;
int num = 0;
cudadeviceprop prop;
cudastatus = cudagetdevicecount(&num);
for(int i = 0;i參考: 
參考:

Caffe原始碼學習3 CUDA程式設計

從0開始學習cuda和caffe原始碼閱讀

GPU程式設計自學3 CUDA程式初探

Caffe原始碼 math functions 解析

Caffe原始碼學習3 CUDA程式設計

從0開始學習cuda和caffe原始碼閱讀

GPU程式設計自學3 CUDA程式初探

Caffe原始碼 math functions 解析

相關推薦