以前寫的mapreduce的wordcount,都忘了怎麼執行了
hadoop jar
/home/dmc/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar
-reducer reducer1.py
-file reducer1.py
-input /user/hujianqiu/wordcount/input_word/*
-output output_word
其中,呼叫的jar包可不是隨便找乙個的,而是要用本機安裝的hadoop-streaming的jar包,因而要找一下hadoop安裝在**,可以使用如下命令:
locate *share/hadoop/tools/lib/hadoop-streaming*
這樣就能很快地定位到hadoop的安裝目錄了 hadoop使用問題
前提 環境 ubuntu 安裝hadoop 已經有一段時間 啟動的時候提示 connection reset by peer 這個檢視日誌,裡面有說 ssh裡面某個檔案的許可權太大 這個ssh裡修改下就可以 eperm operation not permitted 這個之前以為是許可權問題,後來改...
Hadoop使用例項
1.詞頻統計 1.2編寫map與reduce函式 1.3本地測試map與reduce 1.4將文字資料上傳至hdfs上 1.5用hadoop streaming提交任務 1.6檢視執行結果 1.7計算結果取回到本地 加分2.氣象資料分析 如 求每日最高溫度 2.2解壓資料集,並儲存在本地文字檔案中 ...
Hadoop使用例項
1.詞頻統計 1.2編寫map與reduce函式 1.3本地測試map與reduce 1.4將文字資料上傳至hdfs上 1.5用hadoop streaming提交任務 1.6檢視執行結果 1.7計算結果取回到本地 2.氣象資料分析 如 求每日最高溫度 2.2解壓資料集,並儲存在本地文字檔案中 2....