mapreduce 是hadoop的分布式計算系統,是乙個分布式運算程式的程式設計框架。本例項是基於hadoop2.8.5的偽分布式平台。如果jps命令執行後如下圖所示,則偽分布式搭建完成。hadoop偽分布式和完全分布式的搭建後續會進行更新?。為什麼需要mapreduce
先將本地乙個檔案上傳到hdfs
hadoop fs -put readme.txt /
上述/表示將readme.txt 上傳至hdfs根目錄下,也可先建立目錄再指定目錄上傳。
檢視是否上傳成功
hadoop fs -ls
進入mapreduce目錄
cd /usr/local/hadoop/share/hadoop/mapreduce
執行countword程式
hadoop jar hadoop-mapreduce-examples-2.8.5.jar wordcount /readme.txt /count.txt
上述表示執行wordcount程式,輸入為readme.txt ,輸出為count.txt,都放在根目錄下。
hadoop fs -ls /count.txt
檢視countword執行後輸出在count.txt目錄下那個檔案中
hadoop fs -cat /count.txt/part -r -00000
顯示結果
如上圖所示,結果為readme.txt中各單詞的個數。
參考部落格,感謝大佬!!!
mapreduce應用例項
1 mapreduce是乙個程式設計模型,既不是平台也不是特定的語言。面向記錄的資料處理 鍵和值 便於跨多個節點分配任務 2 集群上的資源管理取決於版本 1 mapreduce v1 mrv1,經典mapreduce 使用jobtracker和tasktracker 架構 守護程序啟動和管理map任...
499 單詞計數 Map Reduce版本
原題 您在真實的面試中是否遇到過這個題?是 chunk2 lintcode code bye get mapreduce result bye 2 goodbye 1 google 1 hadoop 1 code 2 lintcode 1 標籤 big data map reduce 思路 沒怎麼看...
原創 MapReduce計數器
mapreduce框架內建了一些計數器的支援,當然,我們也可以設定自己的計數器用來滿足一些特殊的要求。其實計數器可以用來完成很多事,關鍵要看你如何用,例如你想知道map輸入資料的指定記錄特定的資訊有多少可以設定計數,還有,在mr執行過程中,一些特定事件的發生次數也可以記錄。使用計數器的莫大好處在於整...