理論研究 漫談傳統IT基礎設施07 儲存(01)

2021-10-03 17:50:58 字數 2585 閱讀 6930

儲存是個很大的話題,而且講起來比較硬核,很多術語與知識點。我們盡量每一部分都標註重點,以及模擬理解。

儲存是什麼

儲存的核心是硬碟中的磁片。(乙個硬碟有很多塊)

磁碟裡面由多個鋁合金材料做的碟片構成,用於儲存資料。每個碟片會有乙個讀寫磁頭通過磁化碟片來儲存資料。

碟片在格式化被劃分成為許多同心圓,這些同心圓的軌跡叫做磁軌。磁軌從最外圈向最內圈由0開始編號。

碟片上的每個磁軌被等分為若干個弧段,這些弧段便是磁碟的扇區。每個扇區512個位元組,扇區是磁碟可分的最小單位。

所有盤面上的同一磁軌,垂直方向上構成乙個圓柱,叫做柱面。

為減少尋道時間,磁頭讀寫資料時先從同乙個柱面的磁軌0開始操作,然後再去往下乙個柱面。

由於每個扇區的長度相等,因此0磁軌周長最長,扇區最多,且各磁軌角速度相等,因此外層磁軌比內層磁軌讀寫速率要高。

(重點:記住「扇區(sector)是磁碟可分的最小單位」即可,其他「柱面」、「磁軌」那些後面都用不上)

第一步:對磁碟進行格式化:

未格式化的硬碟稱作裸磁碟,不能被作業系統識別或直接使用。

格式化操作將裸磁碟劃分為多個磁軌,並且將多個扇區組成乙個檔案塊(block),塊是作業系統能夠識別與操作的最小單位。(fat32最小塊1kb,最大為4gb,ntfs最小塊4kb,最大64gb)。

格式化操作其內涵是為了將磁碟空間按照檔案系統能夠識別的方法進行編址,以便檔案系統進行讀寫操作。而不同的作業系統能夠支援不同的檔案系統。

其實磁碟也就一樣,裸磁碟相當於超市/圖書館門口那些臨時儲物櫃,每個扇區相當於1個儲物櫃,而作業系統相當於臨時寄存管理員,應用程式相當於帶著行李的遊客。應用程式(遊客)往裸磁碟(儲存櫃)存入東西的時候,租客不是直接隨便找個儲物櫃硬塞的,而是到寄存處,把行李交給管理員,而管理員看看**有空的櫃子,然後把行李存進去,然後把帶有存物櫃編號(編址後,多個扇區組成的檔案系統塊位址)的鑰匙/憑證交給遊客。等應用程式呼叫資料(遊客取行李)的時候,管理員根據憑證(編址),從對應的存物櫃裡面提取行李(資料)提取出來,然後交給遊客。

第二步:對磁碟進行分割槽

分割槽其實就是指定每個分割槽由哪個扇區開始,到那個扇區結束。

分割槽可以使多個分割槽之間的資料進行隔離。

分割槽後各分割槽可以用於格式化不同的檔案系統,並且每個分割槽的格式化操作不會影響另外乙個分割槽。(如平常c盤重灌windows作業系統,不會影響d、e盤資料,資料不會清空)

第乙個扇區主要儲存:(1)主要開機區(master boot record, mbr)及分割表(partition table), 其中 mbr 占有 446 bytes,而 partition table 則占有 64 bytes。

硬碟最多劃分4個物理分割槽(主分割槽/擴充套件分割槽),需要更多的分割槽就要在擴充套件分割槽上面劃邏輯分割槽。

普通檔案系統

以fat32檔案系統為例,對硬碟進行格式化後,多個扇區組成了多個塊,並且對塊進行了編址(下圖每個矩形為1個檔案塊)。

假設每個塊為1kb,乙份4kb大小的檔案,被分為4個檔案塊,分別儲存到塊1、4、7、15中去。

如1、4、7、15檔案塊各位於不同的磁片,那麼每個磁片的磁頭會參與到讀取資料的操作中去。

這種方式讀寫效率低,如1、4、7檔案塊都在第一塊磁碟,本來磁碟轉一圈即可讀取完3個檔案塊,但是由於1後面指向7,所以轉第一圈經過4時不會讀取,讀取7後才知道要讀取4,需要轉第二圈才能夠讀取到4檔案塊。

索引式檔案系統

linux的ext4為索引式檔案系統,磁碟格式化後會生成inode與block,其中block使用者儲存檔案資料,inode用來存放檔案的元資料。每個檔案有唯一的inode編號。當訪問檔案時,會在inode查詢對應編號,找到元資料後,就一次過知道檔案分塊所有的存放位置,這個時候磁碟轉一圈就可以全部資料讀取完畢了。因此讀寫效率較高。

日誌式檔案系統

傳統的檔案系統,如果在寫入過程產生中斷,會產生寫入裝置與被寫入裝置上的資料不一致的問題,將需要啟動資料修復,修復時間長,資源消耗大,所以出現了日誌式檔案系統。

在每次寫入資料之前,會先在日誌記錄快取區中寫下要進行的寫入的資料的資訊,然後才會著手將資料以及元資料寫入到磁碟中,寫入資料完成後,又會將日誌記錄快取區塊中的記錄寫入到磁碟的日誌記錄區,這樣如果中途出現問題,檢視日誌記錄快取區/日誌記錄區,就能找到中斷的位置或者錯誤的原因,重新進行讀寫,排錯時間短,修復時間快。

理論研究 漫談傳統IT基礎設施01 綜述

無論金融 鐵路 通訊等傳統業務,還是電商 外賣 直播等新興網際網路業務,除卻上層的應用軟體與業務平台 軟體 底層都離不開it基礎設施 硬體 的支援。資訊科技日新月異,從unix到linux,物理機到虛擬化,到雲計算 openstack,至目前最熱門最火熱的大資料 docker kurbernetes...

理論研究 漫談傳統IT基礎設施08 儲存(02)

邏輯分割槽 物理硬碟格式化與分割槽後可以直接給作業系統識別使用,可以將擴充套件分割槽進行邏輯分割槽,邏輯分割槽是連續的。邏輯硬碟 為了對資料實時保護,磁碟提供冗餘的效能,可以通過對多塊磁碟進行raid,將物理磁碟組織成邏輯磁碟。對於作業系統層面,不會區分邏輯硬碟或物理硬碟,所有對映給作業系統識別的硬...

理論研究 漫談傳統IT基礎設施03 伺服器(中)

書接上一回,為什麼既有機架式伺服器,又有刀片伺服器呢。刀片伺服器vs機架式伺服器 機房 資料中心,其實就是房地產經濟。機房面積就那麼大,如何在有限的空間內,盡可能地提公升裝機密度,安裝上架更多的機器,那麼單台機器攤分的機房成本就越低,機房的經濟效益就越高。而機架式伺服器通常1臺佔了2u 2cpu的裝...