首先說明一下我的基礎環境: 神舟筆記本;win10 x64 專業版; nvidia gtx1050; vs2013。
cuda_path: c:\program files\nvidia gpu computing toolkit\cuda\v8.0
cuda_path_v8_0: c:\program files\nvidia gpu computing toolkit\cuda\v8.0
number_of_processors: 4
nvcudasamples_root: c:\programdata\nvidia corporation\cuda samples\v8.0
nvcudasamples8_0_root: c:\programdata\nvidia corporation\cuda samples\v8.0
nvtool***t_path: c:\program files\nvidia corporation\nvtool***t\
cuda toolkit安裝成功後會自動和系統的編譯器進行繫結。 以我的vs2013為例,「新建專案」下增加了 「nvidia」選項。
cuda toolkit已經為我們提供了一些簡單的樣例,位於 環境變數 「nvcudasamples_root」所指向的目錄下。 注意,該目錄通常為隱藏目錄。
隨便選擇其中的乙個子專案,如果可以成功執行,則表明cuda確實已經安裝成功。
編譯的時間隨電腦gpu和cpu效能而定,
執行 devicequery,它的執行結果。輸出了這個顯示卡的資訊:
算一下計算能力:858993408 x 0.96=824633671.68 gflops(flops是floating-point operations per second每秒所執行的浮點運算次數的縮寫,它是乙個衡量計算能力的量,gflops就是giga floating-point operations per second,即每秒10億次的浮點運算數),再看看我電腦原來cpu的計算能力:
3 x 4 = 12, gpu的運算能力差不多是cpu的(824633671.68/12=68719472.64…)68719472倍了!!
CUDA並行程式設計系列(1) GPU技術簡介
cuda並行程式設計系列是本人在學習cuda時整理的資料,內容大都 於對 cuda並行程式設計 gpu程式設計指南 gpu高效能程式設計cuda實戰 和cuda toolkit documentation 的整理。通過本系列整體介紹cuda並行程式設計。內容包括gpu簡介 cuda簡介 環境搭建 執...
tensorflow學習筆記1 GPU配置
import tensorflow as tf config tf.configproto config.gpu options.allow growth true config.gpu options.per process gpu memory fraction 0.7 config.gpu o...
GPU計算與CUDA程式設計
1.來自nvidia的 cuda 並行程式設計框架是 gpgpu 正規化的一種特定的實現。它提供了gpu程式設計的簡易介面,基於cuda程式設計可以構建基於gpu計算的應用程式。2.cuda 在技術上是一種異構計算環境,也就是說它利用了同時在 cpu 和 gpu 上的協調計算。cuda 架構由主機 ...