hdfs基本命令:
hadoop fs -cmd
cmd: 具體的操作,基本上與unix的命令列相同
args:引數
hdfs資源uri格式:
scheme://authority/path
scheme:協議名,file或hdfs
authority:namenode主機名
path:路徑
示例:hdfs://localhost:9000/user/chunk/test.txt
假設已經在core-site.xml裡配置了 fs.default.name=hdfs://localhost:9000,則僅使用/user/chunk/test.txt即可。
hdfs預設工作目錄為 /user/$user,$user是當前的登入使用者名稱。
hdfs命令示例:
hadoop fs -mkdir /user/trunk
hadoop fs -ls /user
hadoop fs -lsr /user (遞迴的)
hadoop fs -put test.txt /user/trunk
hadoop fs -put test.txt . (複製到hdfs
當前目錄下,首先要建立當前目錄)
hadoop fs -get /user/trunk/test.txt . (複製到本地當前目錄下)
hadoop fs -cat /user/trunk/test.txt
hadoop fs -tail /user/trunk/test.txt (檢視最後1000位元組)
hadoop fs -rm /user/trunk/test.txt
hadoop fs -help ls (檢視ls命令的幫助文件)
檢視某個檔案是否存在可以這麼做:
hadoop fs -cat hdfs://namenode主機名/user/root/test/word.txt
不用加9000埠號
hadoop沒有當前目錄的概念,當然也不能進入in目錄,更沒有cd命令。所以檢視時必須輸入目錄路徑。
HDFS學習筆記
3 hdfs儲存原理 主節點 資料目錄 元資料 服務 從節點 具體完成資料的儲存任務 hdfs 相容廉價的硬體裝置,實現流資料讀寫,支援大資料集,支援簡單的檔案模型,強大的跨平台相容性 hdfs侷限性 不適合低延遲資料訪問,無法高效儲存大量小檔案,不支援多使用者寫入以及任意修改檔案。1 為了分攤磁碟...
HDFS學習筆記
hdfs學習筆記 hdfs,是hadoop distributed file system的簡稱,是hadoop抽象檔案系統的一種實現。hdfs的檔案分布在集群機器上,同時提供副本進行容錯及可靠性保證。例如客戶端寫入讀取檔案的直接操作都是分布在集群各個機器上的,沒有單點效能壓力。什麼是hdfs 1....
HDFS學習筆記
1 流式資料訪問 一次寫入,多次讀取是最高效的訪問模式。資料集通常由資料來源生成或從資料來源複製而來,每次分析都在該資料集上進行 2 資料塊 檔案的獨立儲存單元,預設64mb 目的是為了最小化定址開銷 塊的元資料存在namenode的記憶體中 hdfs中乙個小於塊大小的檔案不會佔據整個塊的空間 3 ...