(1) 在程式中將顏色快取從32位改為16位,檢視fps值是否增加,以確定瓶頸是否因為幀真快取頻寬引起。
(2) 在nvperfhud中按下ctrl+t將紋理強行設定為2*2大小,檢視fps值是否增加,以確定瓶頸是否因為紋理頻寬引起。
(3) 在nvperfhud中按下ctrl+1、ctrl+2……ctrl+9,nvperfhud會自動強行簡化各個profile的pixel shader程式,檢視fps值是否增加,以確定瓶頸是否因為複雜的畫素程式引起。
(4) 在nvperfhud中按下ctrl+v去掉頂點單元,檢視fps值是否增加,以確定瓶頸是否因為頂點處理引起,包括頂點/索引快取的傳輸、vertex shader程式和無效的快取lock。
(5) 在程式中更改頂點格式的大小,檢視fps值是否增加,如果增加則瓶頸在頂點/索引快取的傳輸。
(6) 可以利用ctrl+n去掉gpu的工作,也就是這個時候gpu的計算速度無限快,如果fps增加則瓶頸在cpu上。
PerfHUD效能分析的一點技巧
1 在程式中將顏色快取從32位改為16位,檢視fps值是否增加,以確定瓶頸是否因為幀真快取頻寬引起。2 在nvperfhud中按下ctrl t將紋理強行設定為2 2大小,檢視fps值是否增加,以確定瓶頸是否因為紋理頻寬引起。3 在nvperfhud中按下ctrl 1 ctrl 2 ctrl 9,nv...
linux kernel原始檔閱讀的一點技巧
根據2018年的乙份調查,linux核心 有6萬 個檔案,2000萬 行 具體資料可以從這裡找到,比如source insight,vscode,vim建立索引都是一項巨大的工程,當查詢函式定義,呼叫關係的時候更是痛不欲生。其實這個時候我們可以借助於網際網路資源,sourceforge上有個lxr專...
效能問題的一點認識
關於程式慢,效能不足的一點認識 1 是不是有邏輯有問題,寫了個死迴圈在 這個會導致程序 執行緒直接掛在 2 邏輯沒問題,但是可能 中某些執行太慢,比如查詢資料庫,資料量很大,sql語句又恨複雜,這個也會導致程式的程序 執行緒卡在那裡。具體方法 檢視程序資訊 aix procstack linux g...