spak 單詞統計簡單例子

2022-07-20 00:42:19 字數 1163 閱讀 7998

spark預設頁面ui 

對應配置檔案

sh start-all.sh  啟動命令

spark-shell啟動

jps看下多了乙個sparksubmit程序

啟動後後台日誌啟動了job的頁面

--編寫個本地檔案 為了後面測試

裝載到rdd中

單詞統計第一種寫法 

sc.textfile("/home/hadoop/a.txt").flatmap(_.split(" ")).map((_,1)).groupby(_._1).mapvalues(_.foldleft(0)(_+_._2)).collect

單詞統計第二種寫法簡單的 

sc.textfile("/home/hadoop/a.txt").flatmap(_.split(" ")).map((_,1)).reducebykey(_+_).collect

C Linux 下簡單實現單詞統計

功能實現 從文字文件裡讀取英文單詞,可能含有中文字元,實現英文單詞,中文字元的數目統計 author 賀榮偉 creat time 16 01 2015 7 10 星期五 include include include include include const int str len 1010 c...

C Linux下簡單實現單詞統計

功能實現 從文字文件裡讀取英文單詞,可能含有中文字元,實現英文單詞,中文字元的數目統計 author 賀榮偉 creat time 16 01 2015 7 10 星期五 include include include include include const int str len 1010 c...

mysql 統計單詞 Spark單詞統計示例

在spark字數統計示例中,將找出指定檔案中存在的每個單詞的出現頻率。在這裡,我們使用scala語言來執行spark操作。執行spark字數計算示例的步驟 在此示例中,查詢並顯示每個單詞的出現次數。在本地計算機中建立乙個文字檔案並在其中寫入一些文字。檢查sparkdata.txt檔案中寫入的文字。c...