Hadoop之HDFS常用檔案操作命令

2021-09-23 10:14:40 字數 1639 閱讀 7123

hadoop fs -cmd < args >
hadoop fs -ls  /dir

hadoop fs -ls -r /dir --列出hdfs檔案系統所有的目錄和檔案

hadoop fs -put   --hdfs file的父目錄一定要存在,否則命令不會執行

hadoop fs -put --hdfs dir 一定要存在,否則命令不會執行

hadoop fs -put - --從鍵盤讀取輸入到hdfs file中,按ctrl+d結束輸入,hdfs file不能存在,否則命令不會執行

hadoop fs -chmod -r 777 /user/hadoop/tem.log --授權讀寫

hadoop fs -get --local file不能和 hdfs file名字不能相同,否則會提示檔案已存在,沒有重名的檔案會複製到本地

hadoop fs -get < hdfs file or dir > ... < local dir >

拷貝多個檔案或目錄到本地時,本地要為資料夾路徑

注意:如果使用者不是root, local 路徑要為使用者資料夾下的路徑,否則會出現許可權問題,

hadoop fs -rm < hdfs file > ...

hadoop fs -rm -r < hdfs dir>...

hadoop fs -mkdir  --只能一級一級的建目錄,父目錄不存在的話使用這個命令會報錯

hadoop fs -mkdir -p --所建立的目錄如果父目錄不存在就建立該父目錄

hadoop fs -cp -- 目標檔案不能存在,否則命令不能執行,相當於給檔案重新命名並儲存,原始檔還存在

hadoop fs -cp --目標資料夾要存在,否則命令不能執行

hadoop fs -mv 目標檔案不能存在,否則命令不能執行,相當於給檔案重新命名並儲存,原始檔不存在

hadoop fs -mv < hdfs file or dir >... < hdfs dir >

源路徑有多個時,目標路徑必須為目錄,且必須存在。

注意:跨檔案系統的移動(local到hdfs或者反過來)都是不允許的

hadoop fs -count --統計hdfs對應路徑下的目錄個數,檔案個數,檔案總計大小
hadoop fs -text < hdsf file>

將文字檔案或某些格式的非文字檔案通過文字格式輸出

hadoop fs -cat /*

hadoop fs -cat /user/hive/back/hs_ods/clientinfo/* >clientinfo.txt

-- 將檔案儲存到local 檔案

補充知識:

mr的執行依賴資料位址,如果資料位址不存在,則會報錯

hadoop dfs -cat /user/hive/warehouse/fundmarket/* |grep '華夏'

Hadoop之HDFS常用操作基礎練習(五)

詳細命令截圖 集群規劃 hadoop的高可用完全分布模式中有hdfs的主節點和資料節點 mapreduce的主節點和任務節點 資料同步通訊節點 主節點切換控制節點總共6類服務節點,其中 hdfs的主節點 mapreduce的主節點 主節點切換控制節點共用相同主機cgt 01和cgt 02,hdfs的...

hadoop的HDFS檔案儲存

1 什麼是hdfs?hdfs適合做 儲存大檔案。上g t甚至p。一次寫入,多次讀取。並且每次作業都要讀取大部分的資料。搭建在普通商業機群上就可以了。雖然會經常宕機,但hdfs有良好的容錯機制。hdfs不適合做 實時資料獲取。如果有這個需求可以用hbase。很多小檔案。因為namenode要儲存hdf...

Hadoop 檔案系統(HDFS)

磁碟傳輸速率100m s,定址時間10ms,讓定址時間是傳輸時間的1 所以塊的大小為 100 0.01s 100m s 100m 128m 在 hdfs default.xml 中搜尋dfs.blocksize,可以修改大小 檔案上傳 檢查檔案block的狀態 由上可見,狀態是健康的 啟動所有資料節...