2.6 習題
1.在檔案sumarraysongpu-timer.cu中,設定block.x=1 023,重新編譯並執行。與執行配置為block.x=1 024的執行結果進行比較,試著解釋其區別和原因。
2.參考檔案sumarraysongpu-timer.cu,設定block.x=256。新建乙個核心,使得每個執行緒處理兩個元素。將此結果和其他的執行配置進行比較。
3.參考檔案summatrixongpu-2d-grid-2d-block.cu,並將它用於整數矩陣的加法運算中,獲取最佳的執行配置。
4.參考檔案summatrixongpu-2d-grid-1d-block.cu,新建乙個核心,使得每個執行緒處理兩個元素,獲取最佳的執行配置。
5.借助程式checkdeviceinfor.cu,找到你的系統所支援的網格和塊的最大尺寸。
《CUDA C程式設計權威指南》 2 6 習題
1.在檔案sumarraysongpu timer.cu中,設定block.x 1 023,重新編譯並執行。與執行配置為block.x 1 024的執行結果進行比較,試著解釋其區別和原因。2.參考檔案sumarraysongpu timer.cu,設定block.x 256。新建乙個核心,使得每個執...
《CUDA C程式設計權威指南》 1 5 總結
隨著計算機架構和並行程式設計模型的發展,逐漸有了現在所用的異構系統。cuda平台幫助提高了異構架構的效能和程式設計師的工作效率。cpu gpu的異構系統在高效能計算領域已經成為主流。這種變化使並行設計範例有了根本性轉變 在gpu上執行資料並行工作,而在cpu上執行序列和任務並行工作。作為完整的gpu...
Cuda C權威指南學習筆記(一)
編譯第乙個hello檔案,首先建立hello.cu include using namespace std intmain 執行nvcc hello.cu o hello,hello得到nvcc編譯得到的可執行檔案並執行 上面沒有用到任何gpu特性,只是個主機程式,下面編寫我們第乙個裝置程式,修改上...