因為要用tensorrt寫自定義層,一定會用到cuda,所以學一下。
– – fuc.cu
fuc.h
test.cu
cmakelists.txt
#include #include "fuc.h"
__global__ void kernel()
extern __global__ void kernel();
#include #include "fuc.h"
int main(void)
cmake_minimum_required(version 2.8)
project(helloworld c cxx)
# find_package()命令首先會在模組路徑中尋找 find.cmake,這是查詢庫的乙個典型方式
# quiet 可選字段,表示如果查詢失敗,不會在螢幕進行輸出(但是如果指定了required欄位,則quiet無效,仍然會輸出查詢失敗提示語)
find_package(cuda quiet required)
# 下面這行注釋掉的**和上面那行**起到一樣的作用
# include(/usr/share/cmake-3.5/modules/findcuda.cmake)
set(cuda_include_dirs /usr/local/a-9.0/include)
set(cuda_library_dirs /usr/local/cuda-9.0/lib64)
include_directories($)
link_directories($)
cuda_add_executable(helloworld test.cu fuc.cu)
cmake_minimum_required(version 2.8)
project(helloworld c cxx)
find_package(cuda quiet required)
set(cuda_include_dirs /usr/local/a-9.0/include)
set(cuda_library_dirs /usr/local/cuda-9.0/lib64)
include_directories($)
link_directories($)
# 原:
# cuda_add_executable(helloworld test.cu fuc.cu)
# 改為以下兩行:
file(glob_recurse current_include ./*.h ./*.hpp ./*.cuh)
cuda_add_executable(cuda_test $)
cuda學習筆記 1
cuda cu 的目的是並行運算。只要在c c 中呼叫以 global 為關鍵字修飾的函式 global void function type inputarraya,type inputarrayb,type outputarraya 稱為核函式,經nvcc編譯,識別到核函式就會編譯成gpu指令碼...
CUDA學習筆記(1) Hello CUDA
cuda的安裝網上的教程有很多,這裡就不做介紹了。cuda使用c語言的語法,擴充套件了一些關鍵字,下面我們使用cuda編寫第乙個程式hello cuda。這裡使用vs 2015新建乙個cuda的專案,在新建專案中,選擇cuda,如下圖顯示 程式 如下 include cuda runtime.h i...
CUDA學習備忘1
一 cuda流程 1設定可用裝置 cudasetdevice 2在gpu上申請資料記憶體 cudamalloc 3將host cpu 資料複製到device gpu cudamemcpy 4呼叫kernel,kernel dg grid db block ns 共享記憶體 s 流5根據情況同步執行緒...