儲存常見術語和概念

2021-06-17 16:00:41 字數 1578 閱讀 5398

1、條帶化(striping)

把資料分片,儲存在多個磁碟以提高資料並行訪問速率,從而提公升i/o效能;

影響條帶化效能有兩個關鍵指標,條帶大小和條帶寬度,條帶大小(striping size)即分片的資料塊大小,資料塊分得越多,就可以並行儲存到更多的磁碟,傳輸效能更高,自然要求控制器有更強的資料塊分片、定位、排隊、合併的能力,反之則傳輸效能降低,對控制器的要求也降低;條帶寬度(striping width),即可併發讀寫的條帶數(例如,磁碟),寬度越大即併發讀寫能越強。

2、寫懲罰(write penality)

寫懲罰是raid中當有資料變更時或寫小資料塊時,需要對磁碟做的額化操作,一般情況下需要做讀條帶資料、讀校驗碼、重寫資料、重寫校驗碼的操作;

3、快照

全拷貝快照:對資料做完全映象,在儲存裝置上要分配同樣大小的空間,同步過程影響寫操作;

差分快照

寫時複製(cow,copy on write)

cow快照需要消耗一些儲存空間--建立快照卷。當我們為乙個資料卷建立乙個快照之後,這些預留的空間用來存放被變化資料更新的舊資料。cow快照在初始化的過程中僅僅建立用來描述源資料塊位置的指標資訊(元資料),而不是完整的將源資料塊拷貝過來。因此初始化的過程幾乎可以在瞬間完成,對系統的影響也很小。

cow快照會跟蹤資料卷的寫操作和資料塊變化。當某個資料塊發生改變時,在將舊的資料覆蓋之前,首先將該塊的舊資料複製到預留的快照卷,該步驟僅在資料卷相應資料塊位置發生第一次寫操作請求時進行。這個處理過程確保快照出來的資料與發起快照的那個精確時間點保持完全一致。這個過程也描述了「copy on write」這個名字的含義。

cow快照的主要優勢在於空間的高效利用,因為快照卷只需要保留發生過變化的資料塊,與資料卷相比要小得多。但是我們也知道cow快照有個缺點,它會引起資料卷效能的下降,這是因為建立快照之後,對資料卷的寫操作會增加乙個等待的過程 --即舊資料塊複製到快照卷的過程。另外乙個關鍵問題是每個快照卷必須依賴乙個完整的資料卷。

寫時重定向(row,redirect on write)

「row重定向寫」與「cow複製寫」是相對的概念,它可以避免兩次寫操作引起的效能損失。row同cow一樣在空間利用方面效率非常高。那是什麼讓row快照避免了寫效能的損耗?其中的原因是row把對資料卷的寫請求重定向給了快照預留的儲存空間,而寫操作的重定向設計則把需要兩次寫才能完成的操作減少為一次寫。我們知道cow的兩次寫包括:1、將舊資料寫入快照卷;2、在資料卷寫入新資料。而row只有寫入新資料一步。

使用row快照,資料卷存放的是上乙個快照時間點的舊資料,新資料最終存放在預留的快照空間。這裡也有乙個複雜的問題,就是快照的刪除。被刪除的快照上的資料必須被複製到原始資料卷,並且做一致性回退。建立的快照越多,維護快照的複雜度也會以指數級別上公升。這些複雜性包括對原始資料的訪問、快照資料和原始資料卷的跟蹤、以及快照刪除後的資料調整。另乙個直接引發的嚴重問題是,原始資料集中會產生大量的碎片。

4、煙囪式架構

首先,傳統it系統多為「煙囪式」架構,一平台一應用,如果需要擴容,原有的架構和部署方式必然發生巨大變化,並且多系統之間很難實現資料共享,擴容成本極高。其次,多套系統造成管理、維護效率低下。研究表明,it系統用於維護的費用佔到整體費用的72%,遠高於首次採購裝置的費用。而這一狀況在進入海量儲存時代後變得更加突出。

5 2 術語和概念

關係 relationship 是事物之間的聯絡。在物件導向的建模中,最重要的 3 中關係是 依賴 泛化和關聯。在圖形上,把關係圖畫成一條線,並用不同的線區別關係的種類。5.2.1 依賴 dependency 是一種使用關係,說明乙個事物 如類 window 使用另乙個事物 如類event 的資訊和...

Bazel 概念和術語

目錄簡介 workspace,packages and targets 工作空間 workspace 倉庫 repositories 包 packages 目標 targets 標籤 labels 標籤的詞彙規範 lexical specification of a label rules buil...

基本概念和術語

資料型別和抽象資料型別 本篇文章將講解資料結構的基本概念和術語,這種概念性的東西往往是催人入睡的,當然了,沒有誰能把概念講出花來,概念就是枯燥的。由於專欄的體系,我有必要講一講關於資料結構的基本概念和術語。資料是指能輸入計算機且能被計算機處理的各種符號的集合。資料是資訊的載體,是對客觀事物符號化的表...