在hadoop內部,具體實現了許多類的檔案系統,當然最最被我們用到的就是他的分布式檔案系統hdfs了。但是本篇文章不會講hdfs的主從架構等東西,因為這些東西網上和資料書中都講得很多了。所以,我決定以我個人的學習所得,來講講hdfs內部的一些有意思的東西,也作為乙個起始點,為後續繼續深入其中模組的學習做基礎。
inode
hadoop也同樣用了類似linux檔案系統中的i-node的概念,即索引節點。inode是乙個抽象類,後面的inodedirectory以及inodefile都是他的子類,這樣就可以做到保持一些共有的屬性。
inodedirectory,inodefile
fsimage
fseditlog
fsdirectory
blockreceived()–資料塊提交方法,資料節點成功接收到乙個資料塊後,必須使用此方法向名字節點提交資料塊資訊。
《hadoop技術內部–hdfs結構設計與實現原理》.蔡斌等
Hadoop分布式檔案系統HDFS
2018年4月21號 主要概述 hdfs是以流式資料訪問模式來儲存超大檔案。執行於商用硬體集群上的 詳細解析 1 超大檔案 就是單個檔案達到幾百mb至幾百tb甚至pb的檔案。2 3 商用硬體集群上 商用硬體就是不貴也不是高可靠的硬體裝置。就是容錯性好,個別節點掛了,對整個系統不產生任何影響,主要是靠...
分布式檔案系統
分布式檔案系統 概述 系統管理員可以利用分布式檔案系統 dfs 使使用者訪問和管理那些物理上跨網路分布的檔案更加容易。通過 dfs,可以使分布在多個伺服器上的檔案在使用者面前顯示時,就如同位於網路上的乙個位置。使用者在訪問檔案時不再需要知道和指定它們的實際物理位置。例如,如果您的銷售資料分散在某個域...
分布式檔案系統
常見的分布式檔案系統有,gfs hdfs lustre ceph gridfs mogilefs tfs fastdfs等。各自適用於不同的領域。它們都不是系統級的分布式檔案系統,而是應用級的分布式檔案儲存服務。google學術 這是眾多分布式檔案系統的起源 google file system 大...