分布式檔案系統之GPFS

2022-04-04 02:27:50 字數 1223 閱讀 5738

gpfs是ibm公司通過完善和發展其tiger shark檔案系統發展而來。gpfs通過共享磁碟結構來實現其強大的擴充套件性。乙個gpfs系統由許多集群節點組成,gpfs檔案系統和應用程式在上面執行。這些節點通過互動網路架構(switch fabric)網路連線磁碟。所有節點對所有磁碟擁有相同的訪問權。檔案被分割儲存在檔案系統中所有的磁碟上。這種條帶化的儲存不僅能夠保證各個磁碟負載均衡,還能夠使系統獲得最高的吞吐量。

gpfs檔案系統架構圖如下:

將檔案系統節點和共享磁碟連線起來的互動網路架構(switch fabric)可能包含san網路,例如fc和iscsi。另外,個人本地磁碟也可以掛載到一些i/o節點,檔案系統節點通過乙個執行在通訊網路上的軟體層來對這些磁碟進行訪問,例如ibm的vsd(virtual share disk),其執行在sp網路上,就是這樣的乙個軟體層。

來自多個節點的對磁碟進行的讀和寫需要進行同步,否則使用者資料和元資料將會崩潰。gpfs採用分布式鎖機制來同步對磁碟的訪問。為了實現系統的高吞吐量,大檔案需要進行分塊,gpfs沒有依賴額外邏輯卷管理層(logical volume manager (lvm) layer)來實現分塊,而是自己實現了分塊機制。通過實現分塊機制,gpfs獲得了對容錯和負載均衡的控制。(一些lvm也有類似的功能,但是他們不可能獲得網路的拓撲)。

gpfs採用256kb(也可以是16kb-1mb)的大資料塊作為磁碟塊大小。當某個單執行緒的應用程式需要讀乙個檔案時,gpfs採用prefetch機制預先將檔案讀到本地io,後端採用並行io的方式,最大限度的發揮頻寬和磁碟的優勢將檔案提取到本地。同樣,不再需要的髒資料快取也採用並行io的方式寫到磁碟。gpfs能夠識別順序,反序等讀寫模式,對於不常見的讀寫模式,gpfs提供介面傳遞prefetch命令給檔案系統。

gpfs也是一種日誌檔案系統,為不同節點建立各自獨立的日誌。日誌中記錄metadata的分布,一旦節點發生故障,可以保證快速恢復資料。

gpfs 通過一套複雜的信令管理機制提供資料一致性,通過這套機制允許任意節點通過各自獨立的路徑到達同乙個檔案。即使節點無法正常工作, gpfs 也可以找到其它的路徑。gpfs在資料保護方面採用資料複製的方式進行,gpfs實現了乙個較為簡單的軟體raid模式,支援資料塊級別的檔案複製。

參考:1.

2.gpfs: a shared-disk file system for large computing clusters

分布式檔案系統

分布式檔案系統 概述 系統管理員可以利用分布式檔案系統 dfs 使使用者訪問和管理那些物理上跨網路分布的檔案更加容易。通過 dfs,可以使分布在多個伺服器上的檔案在使用者面前顯示時,就如同位於網路上的乙個位置。使用者在訪問檔案時不再需要知道和指定它們的實際物理位置。例如,如果您的銷售資料分散在某個域...

分布式檔案系統

常見的分布式檔案系統有,gfs hdfs lustre ceph gridfs mogilefs tfs fastdfs等。各自適用於不同的領域。它們都不是系統級的分布式檔案系統,而是應用級的分布式檔案儲存服務。google學術 這是眾多分布式檔案系統的起源 google file system 大...

分布式檔案系統

缺點是檔案路徑是一致的,只能用於嵌入式檔案的儲存,沒有辦法作為系統請求檔案的儲存,不過對於web2.0可以從設計層面進行一些改善,將使用者的資料互動更多地方在伺服器端,而不是資料庫中,比如使用者的文章就在 com yyy裡面,但是這又帶來一些新的問題,檔案同步負載均衡等問題。現在著眼於將自製的web...