磁碟讀寫速度的關鍵之一:cache
cache技術最近幾年,在磁碟儲存技術上,發展的非常迅速,作為高階儲存,cache已經是整個儲存的核心所在,就是中低端儲存,也有很大的cache存在,包括最簡單的raid卡,一般都包含有幾十,甚至幾百兆的raid cache。
cache的主要作用是什麼呢?作為快取,cache的作用具體體現在讀與寫兩個不同的方面:作為寫,一般儲存陣列只要求資料寫到cache就算完成了寫操作,當寫cache的資料積累到一定程度,陣列才把資料刷到磁碟,可以實現批量的寫入。所以,陣列的寫是非常快速的。至於cache資料的保護,一般都依賴於鏡相與電池(或者是ups)。
cache在讀資料方面的作用一樣不可忽視,因為如果所需要讀取的資料能在cache中命中的話,將大大減少磁碟尋道所需要的時間。因為磁碟從開始尋道到找到資料,一般都在6ms以上,而這個時間,對於那些密集型i/o的應用可能不是太理想。但是,如果能在cache儲存的資料中命中,一般響應時間則可以縮短在1ms以內。
不要迷信儲存廠商的iops(每秒的io數)資料,他們可能全部在cache命中的基礎上做到的,但是實際上,你的cache命中率可能只有10%。
讀操作方面的效能差異
如上面介紹,磁碟陣列讀操作的關鍵更多的體現在cache的命中率上。所以,raid5和raid10在讀資料上面,他們基本是沒有差別的,除非是讀的資料能影響cache命中率,導致命中率不一樣。
根據我本人的經驗,在連續寫操作過程,如果有寫cache存在,並且演算法沒有問題的話,raid5比raid10甚至會更好一些,雖然也許並沒有太大的差別。(這裡要假定儲存有一定大小足夠的寫cache,而且計算校驗的cpu不會出現瓶頸)。
因為這個時候的raid校驗是在cache中完成,如4塊盤的raid5,可以先在記憶體中計算好校驗,同時寫入3個資料+1個校驗。而raid10只能同時寫入2個資料+2個鏡相。
如上圖所示,4塊盤的raid5可以在同時間寫入1、2、3到cache,並且在cache計算好校驗之後,我這裡假定是6(實際的校驗計算並不是這樣的,我這裡僅僅是假設),同時把三個資料寫到磁碟。而4塊盤的raid10不管cache是否存在,寫的時候,都是同時寫2個資料與2個鏡相。
根據我前面對快取原理的介紹,寫cache是可以快取寫操作的,等到快取寫資料積累到一定時期再寫到磁碟。但是,寫到磁碟陣列的過程是遲早也要發生的,所以raid5與raid10在連續寫的情況下,從快取到磁碟的寫操作速度會有較小的區別。不過,如果不是連續性的強連續寫,只要不達到磁碟的寫極限,差別並不是太大。
離散寫方面的效能差異
這裡可能會較難理解,但是,這一部分也是最重要的部分。企業中的絕大部分資料庫應用,如erp系統等等在資料寫入的時候其實都是離散寫。
例如oracle 資料庫每次寫乙個資料塊的資料,如8k;由於每次寫入的量不是很大,而且寫入的次數非常頻繁,因此聯機日誌看起來會像是連續寫。但是因為不保證能夠添滿raid5的乙個條帶(保證每張盤都能寫入),所以很多時候更加偏向於離散寫入。
我們從上圖看一下離散寫的時候,raid5與raid10工作方式有什麼不同。如上圖:我們假定要把乙個數字2變成數字4,那麼對於raid5,實際發生了4次io:
先讀出2與校驗6,可能發生讀命中
然後在cache中計算新的校驗
寫入新的數字4與新的校驗8
如上圖我們可以看到:對於raid10,同樣的單個操作,最終raid10只需要2個io,而raid5需要4個io。
這裡我忽略了raid5在那兩個讀操作的時候,可能會發生讀命中操作的情況。也就是說,如果需要讀取的資料已經在cache中,可能是不需要4個io的。這也證明了cache對raid5 的重要性,不僅僅是計算校驗需要,而且對效能的提公升尤為重要。我本人曾經測試過,在raid5的陣列中,如果關閉寫cache,raid5的效能將差很多倍。
當然,我並不是說cache對raid10就不重要了,因為寫緩衝,讀命中等,都是提高速度的關鍵所在,不過的是,raid10對cache的依賴性沒有raid5那麼明顯而已。
到這裡,大家應當也大致明白了raid5與raid10的原理與差別了,一般來說,象小io的資料庫型別操作,建議採用raid10,而大型檔案儲存,資料倉儲,則從空間利用的角度,可以採用raid5。
RAID 5和RAID 10 的比較
raid5 和 raid10 誰好誰差,仁者見仁,智者見智,沒有統一的說法。使用的情況實際上是需要根據企業的具體需求來定點。在這裡 我們分別討論下他們的效能和在什麼情況下更適宜使用哪種raid 方式。為了更清楚他們的原理,我們拿四塊硬碟分別做這兩種raid,且從以下的幾個 方面來比較。這裡raid5...
建立raid10(五塊磁碟)
建立raid10 五塊磁碟 raid10 5塊磁碟 上乙個bolg已經做了 raid5 3 個raid 2 個備份 在此條件下繼續以下步驟 1.先將磁碟系統解除安裝 2.看系統掛載裡是否還有md0 發現沒有了md0 3.使用mdadm命令建立raid10,名稱為 dev md0 4.格式化 5.掛載...
Raid5磁碟陣列raid資訊丟失資料恢復過程
北亞資料恢復中心接收到客戶的一台hp dl380 g4伺服器,伺服器使用hp smart array控制器掛載了一台國產磁碟陣列,磁碟陣列由14塊146g scsi硬碟組成一組raid5。作業系統為linux,構建了nfs ftp,作為公司內部檔案伺服器使用。由於伺服器機房進行搬遷,搬遷過程中管理員...