現代GPU的體系結構

2021-07-06 09:45:05 字數 981 閱讀 1387

《大規模並行處理器程式設計實戰(第2版)》全面更新了並行程式設計方法和技術的內容。本書旨在綜述並行程式設計,展示了專業人士和學生都可以使用的一種程式設計思維,以此來指導並行程式設計和優化應用程式,從而使效能得到顯著提公升。本節為大家介紹現代gpu的體系結構。

ad:

1.2  現代gpu的體系結構

採用cuda體系結構的g80系列晶元,其儲存器頻寬可以達到86.4gb/s,並通過第二代pci express匯流排介面與cpu之間進行通訊。cuda應用程式從系統記憶體中傳輸資料的頻寬和將資料上傳回系統記憶體中的頻寬都可以達到4gb/s,從而使得總頻寬可以達到8gb/s。最新的gpu已經開始使用第三代pci express,這使得單個方向上的頻寬達到了8gb/s。隨著gpu儲存容量的擴大,應用程式所需的資料基本能夠儲存在全域性儲存器(global memory)中,只有當呼叫只能在cpu上使用的例程庫時,才需要與cpu端系統記憶體進行通訊。將來在系統記憶體中cpu匯流排頻寬增長的同時,通訊頻寬也會隨之增長。

gtx680系列晶元支援16 384個執行緒,雙精度浮點運算速度可以達到每秒1.5萬億次(1.5 teraflops)。乙個組織良好的應用程式在這種晶元上一次可同時執行5000~12 000個執行緒。多核cpu也支援多執行緒,但同時執行的執行緒數量取決於cpu中核心的數量,如intel的cpu可以同時執行2個或4個執行緒。然而,現在的cpu越來越多地使用單指令多資料(single instruction, multiple data,simd)指令,提高數值計算效能。gpu和cpu支援的並行水平越來越高。在開發計算應用程式時,並行水平對效能而言至關重要。

book tel:(010)68476606】

回書目上一節下一節

原文:1.2 現代gpu的體系結構

返回讀書頻道首頁

GPU體系結構

gpu的硬體結構,也不是具體的硬體結構,就是與cuda相關的幾個概念 thread,block,grid,warp,sp,sm。sp 最基本的處理單元,streaming processor 最後具體的指令和任務都是在sp上處理的。gpu進行平行計算,也就是很多個sp同時做處理 sm 多個sp加上其...

mysql 體系結構 了解MySQL體系結構

mysql 資料庫體系結構圖 mysql 由以下幾部分組成 1 connectors 不同語言中與 sql 的互動 show variables like connection variable name value character set connection utf8 collation c...

簡述mysql體系結構 MySQL體系結構

一 mysql登入方式 一 tcp ip方式 遠端 本地 mysql uroot poldboy123 h 10.0.0.51 p3306 二 socket方式 mysql uroot poldboy123 s tmp mysql.sock 二 例項介紹 例項 mysqld後台守護程序 主線程 ma...