隨著大資料時代的到來,對儲存設施的效能以及安全等要求也越來越高。
軟體體系架構也從曾經的saas(軟體即服務)到paas(平台即服務)再到iaas(基礎設施即服務)的發展。
ceph就是這麼乙個iaas的雲儲存服務的乙個開源解決方案。它是統一儲存系統。
接下來介紹一下儲存(海量資料儲存):
網路儲存技術(network storsge technology)主要分為三種技術:直連式儲存(direct attached storage、das)、網路連線儲存(network attached storage、nas)、儲存區域網路(storage area network、san)。
das:伺服器與儲存系統直接連線
當鏈結外接系統的伺服器不多
且伺服器地理分散
未來對系統擴充套件要求不高
儲存容量也不大
可才用das
系統。根據
das系統的介面,可以採用光纖通道技術、
sas介面或
scsi
介面卡。根據對儲存效能的要求,可採用光纖
/sas
高效能硬碟、大容量
sata
硬碟或磁碟陣列。
nas:通過網路連線的儲存。一般才用乙太網連線。
nas部署簡單。可用於混合各種任何系統區域網內,但檔案共享訪問占用網路頻寬。採用高效能光纖介面硬碟或大容量
sata
硬碟,還可採用磁碟陣列。
nas可擴充套件
1tb甚至上千tb。
san:通過專用網路連線的儲存,多台伺服器通過儲存網路訪問
san系統,實現儲存整合資料、集中管理、可擴充套件性高。
san幾乎可以無限擴充套件,可擴充套件
1tb甚至
pb以上
隨著資訊化程度的提公升,這三種方式共同迅速發展、尤其是
nas和
san這倆優勢互補
雲儲存技術:雲儲存系統主要由四部分組成:儲存層、基礎管理層(核心)、應用介面層、訪問層。
傳統儲存結構通常採用**儲存結構,由高速儲存(cache、sram組成)、主儲存器(dram)和輔助儲存器(disk組成)。在整個儲存的多級層次中,由上至下分為**,容量逐級增加,速度逐漸降低,單位成本逐漸減少。而整個系統其實又可以看成兩個層次:分別是cache-主存層次和主存輔存層次。
其中塊(block)是相鄰兩級間資料交換的單位
說了這麼多題外話算是為這個簡介做個鋪墊,接下來是正題了:
ceph是一種統一的儲存系統,又是分布式儲存系統。它的特點或者說是優點是:高效能、高可靠性、高擴充套件性。ceph儲存集群的部署都始於部署乙個乙個ceph節點、網路和儲存集群。ceph儲存集群至少需要乙個ceph monitor和兩個osd守護程序,所以最小也是個三節點集群。而執行ceph檔案系統客戶端(cephfs)必須要有元資料伺服器(mds、metadata server)。
其中osd的意思是物件儲存,英文名叫object-based storage device。上文介紹過san和nas。這兩種是我們比較熟悉的兩種主流網路儲存結構,而物件儲存是我們比較熟悉的一種新的網路儲存結構,基於物件儲存技術的裝置就是物件儲存裝置。物件儲存兼具san高速直接訪問磁碟特點及nas分布式共享特點。
物件儲存結構的核心是將資料通路(資料的讀或寫)和控制通路(元資料)分離,並基於osd構建儲存系統,每個osd具有一定的智慧型,能夠自動管理其上的資料分布。元件圖如下所示:
ceph的底層是rados(分布式物件儲存:a reliable autonomous distributed object storage)它由兩個元件組成:osd提供儲存資源、monitor維護整個ceph集群的全域性狀態。
接下來再介紹下對映,整個儲存過程也是一層一層的進行的,而這一過程又是通過對映進行儲存設施的底層操作。
對映:ceph的命名空間是(pool,object)每個object都會對映到一組osd中。
接下來的過程:(pool,object)→(pool,pg)→osd set→disk
具體的過程是這樣的:在ceph中,object先對映到pg,再由pg對映到osd set,每個pool有多個pg,每個object通過計算hash值並做取模運算得到它所對應的pg。pg再對映到一組osd,第乙個osd是primary,剩下的都是replicas。
其中用到了以下幾種演算法:
client從monitors中得到crushmap、osd map、crush ruleset,然後使用crush演算法計算出object所在的osdset。所以ceph不需要name伺服器,client直接和osd進行通訊。
ceph架構簡介
在測試openstack的後端儲存時,看到了ceph作為後端儲存時的各種優勢 於是查詢資料,總結了這篇ceph架構的部落格,介紹了ceph的架構和ceph的核心元件。ceph整體十分龐大,本文只是介紹了整體架構和概念,想要詳細檢視ceph請看博文 ceph介紹及原理架構分享 ceph是乙個統一的分布...
Ceph學習之路(一)之ceph初識
在學習ceph之前,需要了解元資料的概念。元資料又稱為中介資料 中繼資料,為描述資料的資料。主要描述資料屬性的資訊,用來支援如指示儲存位置 歷史資料 資源查詢 檔案記錄等功能。通俗地說,就 是用於描述乙個檔案的特徵的系統資料,比如訪問許可權 檔案擁有者以及檔案資料庫的分布資訊 inode 等等。在集...
ceph學習筆記
ceph學習 ceph 儲存集群 配置與部署 準備硬碟 作業系統和 ceph osd 守護程序資料分別放到不同的硬碟。如果必須把資料和系統放在同一硬碟裡,最好給資料分配乙個單獨的分割槽!檔案系統 osd 守護程序有賴於底層檔案系統的擴充套件屬性 xattr 儲存各種內部物件狀態和元資料。底層檔案系統...