大資料學習筆記18 hdfs 解決大資料儲存

2021-09-02 21:46:35 字數 579 閱讀 5300

hdfs--解決大資料儲存

1、hdfs 之前解決大資料儲存 可以使用 nfs

1.1   network file system  網路檔案系統

1.2  nfs問題1  :大檔案集中儲存,併發訪問單節點 壓力大

1.3 nfs問題2   : 有單點故障問題 ,需要別的方式提供高可用處理

2、hdfs 的方案

2.1   檔案劃分為block  分散儲存到多個節點上--  讀大檔案時可以從分散的多個節點上讀取 減輕單節點壓力

2.2   乙個block儲存多個備份---提高檔案高可用性  即使某個節點掛掉只要還有乙個節點上有可用的 備份

整個檔案扔可用。

2.3   namenode: 就像乙個總目錄 記錄各個檔案的詳細的分布情況。

2.4   datanode :  資料節點 實際存放檔案資料的地方 。

大資料 學習hdfs

hdfs是什麼?hadoop distributed file system,它是一種分布式檔案儲存系統,主要解決大資料的儲存問題。hdfs的優缺點 優點 缺點 hdfs的主要角色 namenode 簡稱nn 是hdfs的核心節點,最重要 主要功能是 接收客戶端的讀寫請求,接收datanode傳送的...

大資料學習 關於hdfs

高容錯性 適合處理大資料 可構建在廉價機器上 不適合低延時資料訪問 無法高效的對大量小檔案進行儲存 儲存大量小檔案的話,它會占用namenode大量的記憶體來儲存檔案目錄和塊資訊。小檔案儲存的定址時間會超過讀取時間 不支援併發寫入 檔案隨機修改 乙個檔案只能有乙個寫,不允許多個執行緒同時寫 data...

大資料學習Hdfs詳解1

hdfs架構設計 主從 nn 主 名稱節點 扮演老大的角色 snn 第二名稱節點 nn 扮演二把手的角色 dn 從 資料節點 扮演小弟的角色 dfs.blocksize 134217728 128m 不滿128m也算乙個塊 例如 hdfs site.xml下的引數dfs.replication 為1...