如題。
今天細想了下合批這個東西。
合批是節省了cpu的相關準備工作的工作量。
合批後,經過vs,ps,嘗試測試,模板測試後,此時已沒有了紋理,頂點,索引的概念,只剩下乙個個孤立的畫素,各畫素間沒有任何關係了。
畫素送到gpu後進行批量處理,呈現到螢幕硬體上。
因此合批與gpu沒有任何關係,也幾乎沒有影響。不管是一批還是多批,最終在此幀送到gpu的畫素數量是相等的,資料是相同的。
分成多批,是一幀內將畫素資料分多次提交給gpu。
合批與否,對gpu的影響僅是畫素到達的慢了還是快了,幾乎不影響gpu的效能
posted on 2019-03-26 12:16收藏
CPU對GPU的資源更新
一共有四個方法進行對資源進行更新 cpu呼叫 id3d11devicecontext map gpu呼叫 id3d11devicecontext copysubresourceregion id3d11devicecontext copyresource id3d11devicecontext up...
組成 GPU與CPU的比較
不管是cpu還是gpu都是很高速的裝置,然而從主存中取資料會很慢很慢,為了充分利用高速裝置,二者都使用了快取,程式設計一定要考慮的是電腦程式的區域性性 locality 的基本屬性 時間區域性性與空間區域性性。多核時代和gpu並行運算時代來臨,另外乙個影響程式執行的速度的關鍵因素 快取一致性 cac...
關於CPU與GPU的同步問題
前兩天在寫 的時候,想到這個問題,我的程式gpu要把結果輸出到深度緩衝區,然後交給cpu查詢,gpu不是通用處理器,通常的 p是不合適的。又仔細讀了opengl ext spec,發現nvidia的occlusion query考慮到了這個問題,是我一直沒有讀到,還是把這些天的一些簡單筆記寫一下。標...