cache的分級體系設計
微處理器效能由如下幾種因素估算:
效能=k(fⅹ1/cpi-(1-h)ⅹn)
式中:k為比例常數,f為工作頻率,cpi為執行每條指令需要的週期數,h為cache的命中率,n為儲存週期數。
雖然,為了提高處理器的效能,應提高工作頻率,減少執行每條指令需要的週期數,提高cache的命中率。同時分發多條指令和採用亂序控制,可以減少cpi值;採用轉移**和增加cache容量,可以提高h值。為了減少儲存週期數n,可採用高速的匯流排介面和不分塊的cache方案。
以前提高處理器的效能,主要靠提高工作頻率和提高指令級的並行度,今後則主要靠提高cache的命中率。設計出無阻塞cache分級結構。
cache分級結構的主要優勢在於,對於乙個典型的一級快取系統的80%的記憶體申請都發生在cpu內部,只有20%的記憶體申請是與外部記憶體打交道。而這20%的外部記憶體申請中的80%又與二級快取打交道。因此,只有4%的記憶體申請定向到dram中。
cache分級結構的不足在於快取記憶體組數目受限,需要占用線路板空間和一些支援邏輯電路,會使成本增加。綜合比較結果還是採用分級cache。
l1 cache的設計有在片一級分離和統一設計兩種方案。
intel、amd、原dec等公司將l1 cache設計成指令cache與資料cache分離型。因為這種雙路快取記憶體結構減少了爭用快取記憶體所造成的衝突,改進了處理器效能,以便資料訪問和指令呼叫在同一時鐘週期內進行。
但是,僅依靠增加在片一級cache的容量,並不能使微處理器效能隨之成正比例地提高,還需設定二級cache。
在l1 cache結構方面,一般採用回寫式靜態隨機儲存器(sram)。目前,l1 cache容量有加大的趨勢。
l2 cache的設計分晶元內建和外接兩種設計。
如amd k6-3內建的256kb l2 cache與cpu同步工作。外接l2 cache,一般都要使二級cache與cpu實現緊密耦合,並且與在片一級cache形成無阻塞階層結構。同時還要採用分離的前台匯流排(外部i/o匯流排)和後台匯流排(二級cache匯流排)模式。
顯然,將來隨著半導體整合工藝的提高,如果cpu與二級cache整合在單晶元上,則cpu與二級cache的耦合效果可能更佳。
由於l2 cache內建,因此,還可以在原主機板上再外接大容量快取1mb~2mb,它被稱為l3 cache。
pc中的cache技術的實現
pc中cache的發展是以80386為界的。
知乎建立內容分級體系
techweb 8月9日訊息,繼今年5月公布獲得感新內容標準之後,知乎近日進一步披露該標準的落地進展。據悉,知乎已經在獲得感標準下建立統一的內容分級體系,以優化社群內容結構和創作生態。根據知乎方面披露的資料,該標準實施的兩個月內,知乎數個核心領域的流量 互動量均得到超過一倍增長,其中 量最高增幅達到...
Cache 設計概要
cache設計需要考慮以下問題 1.cache的資料同步問題 2.cache的更新問題 對於資料同步,必須考慮多執行緒相關技術,要點有 1.lock關鍵字 2.readerwriterlock readerwriterlockslim 3.interlocked 4.mutex 5.monitor ...
Cache的原理 設計及實現
cache的原理 設計及實現 前言 雖然cpu主頻的提公升會帶動系統效能的改善,但系統效能的提高不僅僅取決於cpu,還與系統架構 指令結構 資訊在各個部件之間的傳送速度及儲存部件的訪問速度等因素有關,特別是與cpu 記憶體之間的訪問速度有關。若cpu工作速度較高,但記憶體訪問速度相對較低,則造成cp...