大資料處理技術之HDFS基本命令列操作

2021-10-23 06:33:26 字數 1124 閱讀 1164

vi text1.txt

vi text2.txt

2.在hdfs系統根目錄下建立目錄input,在input目錄下建立新目錄files,並將本地檔案text1.txt上傳至hdfs系統files目錄;

//在hdfs系統根目錄下建立目錄input

hdfs dfs -mkdir /input
//在input目錄下建立新目錄files

hdfs dfs -mkdir /input/files
//將本地檔案text1.txt上傳至files目錄

hdfs dfs -put text1.txt /input/files
3.將本地檔案text2.txt的內容追加到hdfs系統text1.txt檔案末尾;

4. 使用命令檢視hdfs檔案text1.txt的內容;

hdfs dfs -cat /input/files/text1.txt
5. 在hdfs系統的input目錄下建立新目錄myfiles,然後複製files目錄下的檔案text1.txt到myfiles目錄,並重命名為text.txt;

hdfs dfs -mkdir /input/myfiles

hdfs dfs -cp /input/files/text1.txt /input/myfiles/text.txt
6. 檢視input目錄下的所有目錄和檔案;

hadoop fs -lsr /input

7. 刪除files目錄下的檔案text1.txt;

hdfs dfs -rm /input/files/text1.txt

hdfs dfs -get /input/myfiles/text.txt ~/text.txt

大資料處理技術之資料整合

大資料處理技術是乙個十分重要的工作,就好比做菜,我們做菜之前就需要對蔬菜進行清洗,洗過的菜我們才能夠吃的放心,同時還有助於我們的身體健康。而大資料處理就好比清洗蔬菜一樣,當我們對資料整理以後,我們才能夠分析出乙個準確的結果。而大資料處理的技術有很多,其中最常見的就是資料整合,那麼什麼是資料整合呢?下...

大資料處理技術之冗餘消除

我們在分析資料的時候,需要對資料進行整理,這樣就能夠方便資料分析工作。當然,資料加工是資料分析工作之前的工作,而在大資料處理中有很多資料整理的技術,其中最常見的就是冗餘消除,那麼什麼是資料冗餘呢?在這篇文章中我們就詳細地給大家解答一下這個問題。而對於普通的資料傳輸和儲存,這就涉及到了乙個技術,那就是...

大資料處理技術 基礎介紹

1.5個v 1 volume 高容量 2 velocity 高速度 3 variety 多樣性 4 veracity 真實性 5 value 價值性 2.工作 1 儲存 2 管理 3 分析 這裡主要講這個 3.大資料分析 通過對大量資料進行分析,挖掘發現其中的模式和模型。1 valid 對新資料有效...