1. 常用2u 伺服器配備有8張nvidia tesla v100 gpu卡,效能測試結果說明:
如果你具有一台伺服器,並且購買了超強計算能力的gpu卡,那麼恭喜你,可以進行一次關於計算機超萬億次計算能力的體驗。
接下來是您要做的:
我們來說說cuda包是幹嘛的,首先大家都知道,驅動,就是對應硬體裝置的使能軟體,那麼為什麼又需要cuda這個東西呢。
因為我們要使用gpu的話,是為了把應用程式跑到gpu上面,那麼,就只能通過nvidia他自己提供的api,以及lib庫,來使用它的gpu。
可以看到下面這張圖,從下至上,從屋裡裝置到應用加速,其中涉及的很多中介軟體。
安裝完成之後,
使用 nvidia-,按tab,來檢視nvidia相關的一些相關命令,
nvidia-smi: 而其中最常用的就是nvidia-smi 這個命令,可以檢視一下幫助文件。這個命令會列印每張卡的溫度,記憶體利用,gpu利用率,功耗,執行的任務,等等。
note:如果您沒有發現該命令, 請確認,是否使用了yum localinstall *.rpm 進行了本地安裝,提示安裝完成了,但在此之後,並沒有把很多相關依賴的包進行安裝,進入
/etc/yum.repos.d/ 目錄,此時,多了乙個yum源的配置檔案,叫cuda***,檢視內容,會發現,它指向了/var/路徑,進入到此路徑之後,發現會有一大批的包沒有安裝,
此時,把所有的包都進行安裝,才是安裝完成。
要進行測試的話,其實很簡單,cuda它本身提供了很多的sample程式,並且其中的乙個cublas,也是用來進行測試gpu計算能力的程式。
當然,你也可以對這些程式進行參考,寫自己的程式。
下面我們來跑乙個例子,進入到目錄:/usr/local/cuda-9.0/samples/5_simulations/
可以看到,其中有乙個nbody程式的資料夾,
這個程式,是對物理學中n個質子,說白了就是n個物體,進行互相之間的萬有引力計算,會涉及很對大量的單雙精度浮點的計算,該程式就是實現了這個計算過程,並且呼叫了gpu,還可以讓使用者通過命令列引數,來控制程式執行的過程。
cd ./nbody 進入到該資料夾。
make
執行:./nbody -benchmark
。此時可以看到程式執行了,並且會列印出來一些可選的引數,如果要使用8個卡均執行的話,那就在linux上面執行8個程序,每個程序分別繫結到單卡即可。
具體值如下:
9958.723
9942.739
9919.522
9852.494
9757.071
9717.97
9670.115
9592.821
根據官方提供的10.6tflops的理論效能值,以及官網描述的能夠達到80%的實際測量值即可,可知,這些測量資料,是效能幾乎接近了理論值,達到了94%的效能。
接下來會寫一篇關於gpu 卡直通的部落格,歡迎繼續關注。
今天在裝了乙個boost等一堆rpm包之後,
gpu的效能已經跑到了標準值。
結果如下:
= 10426.414 single-precision gflop/s at 20 flops per interaction
= 10417.990 single-precision gflop/s at 20 flops per interaction
= 10424.031 single-precision gflop/s at 20 flops per interaction
= 10413.620 single-precision gflop/s at 20 flops per interaction
= 10415.790 single-precision gflop/s at 20 flops per interaction
= 10408.605 single-precision gflop/s at 20 flops per interaction
= 10400.214 single-precision gflop/s at 20 flops per interaction
= 10392.723 single-precision gflop/s at 20 flops per interaction
GPU效能 Overdraw功能
overdraw功能 總填充數峰值 專案執行過程中,單幀總填充畫素數量的最大值 m表示百萬,20m就是說有一幀內填充了 2000 萬個畫素 填充倍數峰值 專案執行過程中,單幀的最大填充倍數。10.0x相當於在這一幀螢幕重新整理了 10遍 單幀填充倍數 該幀總填充數 該幀渲染相機的解析度 需要注意的地...
GPU效能優化,One Step!
overdraw 該模組可以幫助使用者直接檢視專案執行時每幀都渲染的畫素數量,從而反映出裝置gpu端所承受的壓力。我們可以看到下面的中有地方是黑色,有地方是紅色。顏色越紅,表示該處畫素在當前幀中被填充的次數較多,進而gpu的壓力也就越大。移動vr開發者需要特別關注這部分的情況。下圖是效能檢測報告中的...
kafka效能測試1 0 0
kafka提供工具kafka producer perf test.sh用以壓測,引數說明 messages 生產者傳送總的訊息數量 message size 每條訊息大小 batch size 每次批量傳送訊息的數量 topics 生產者傳送的topic threads 生產者使用幾個執行緒同時傳...