摘要
本文主要講述cuda的變數修飾符以及其效能。
1. 變數型別
__device__:位於gpu顯示卡的記憶體(視訊記憶體)中,用於全域性通訊,可稱為global memory。
__shared__:共享儲存,必須定義在kernal最前,定義時不能賦值。
__constant__:在kernal執行過程中不能修改,但是可以在__host__中修改。
__register__:臨時變數(可以選擇用__register__修飾)
2. 記憶體訪問速度
訪問速度順序為:register>shared>constant>local>device
cuda的內建變數
thread 執行緒 乙個執行緒可作為乙個運算單元,多個thread可組成乙個block 塊 threadidx.x block中當前thread在x方向上的id.threadidx.y block中當前thread在y方向上的id.block 塊 乙個block中可包含多個thread,多個blo...
CUDA學習筆記之 CUDA儲存器模型
gpu片內 register,shared memory 板載視訊記憶體 local memory,constant memory,texture memory,texture memory,global memory host 記憶體 host memory,pinned memory.cuda儲...
CUDA學習筆記之 CUDA儲存器模型
標籤 cuda 儲存binding cache 程式設計api 2010 01 03 20 32 5577人閱讀收藏 舉報 cuda 6 cuda儲存器模型 gpu片內 register,shared memory 板載視訊記憶體 local memory,constant memory,textu...