使用hadoop做wordcount筆記

2021-08-02 08:01:47 字數 469 閱讀 3350

以前寫的mapreduce的wordcount,都忘了怎麼執行了

hadoop  jar

/home/dmc/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar

-reducer reducer1.py

-file reducer1.py

-input /user/hujianqiu/wordcount/input_word/*

-output output_word

其中,呼叫的jar包可不是隨便找乙個的,而是要用本機安裝的hadoop-streaming的jar包,因而要找一下hadoop安裝在**,可以使用如下命令:

locate *share/hadoop/tools/lib/hadoop-streaming*
這樣就能很快地定位到hadoop的安裝目錄了

hadoop使用問題

前提 環境 ubuntu 安裝hadoop 已經有一段時間 啟動的時候提示 connection reset by peer 這個檢視日誌,裡面有說 ssh裡面某個檔案的許可權太大 這個ssh裡修改下就可以 eperm operation not permitted 這個之前以為是許可權問題,後來改...

Hadoop使用例項

1.詞頻統計 1.2編寫map與reduce函式 1.3本地測試map與reduce 1.4將文字資料上傳至hdfs上 1.5用hadoop streaming提交任務 1.6檢視執行結果 1.7計算結果取回到本地 加分2.氣象資料分析 如 求每日最高溫度 2.2解壓資料集,並儲存在本地文字檔案中 ...

Hadoop使用例項

1.詞頻統計 1.2編寫map與reduce函式 1.3本地測試map與reduce 1.4將文字資料上傳至hdfs上 1.5用hadoop streaming提交任務 1.6檢視執行結果 1.7計算結果取回到本地 2.氣象資料分析 如 求每日最高溫度 2.2解壓資料集,並儲存在本地文字檔案中 2....