題目:給定一組鍵值對(「spark」,2),(「hadoop」,6),(「hadoop」,4),(「spark」,6),鍵值對的key表示圖書名稱,value表示某天圖書銷量,請計算每個鍵對應的平均值,也就是計算每種圖書的每天平均銷量。
很顯然,對於上面的題目,結果是很顯然的,(「spark」,4),(「hadoop」,5)。
package cn.com.day1
import org.apache.spark.sparkconf
import org.apache.spark.sparkcontext
object test_05
}
執行結果:
(spark,4)
(hadoop,5)
將普通的鍵值對轉換成xml形式的鍵值對
size medium 今天在做foa網域名稱轉出的時候,有乙個註冊 和註冊公司的對應關係。就是說通過poll埠你可以查到註冊 然後通過這個對應關係找到對應公司。於是想把普通文字中的鍵值對,轉換成xml檔案。a.txt檔案中的內容 原始檔中沒有 為了好判斷,將空格轉換成 size 1 reserve...
spark鍵值對操作 一
鍵值對rdd也叫做pair rdd 把乙個普通 rdd轉換為pair rdd的時候使用map 函式來實現 使用第乙個單詞作為乙個鍵,建立乙個pair rdd pairs lines.map lambda x x.split 0 x reducebykey func 合併具有相同鍵的值 rdd.red...
Spark學習筆記 鍵值對操作
鍵值對 rdd是 spark 中許多操作所需要的常見資料型別 鍵值對 rdd 通常用來進行聚合計算。我們一般要先通過一些初始etl 抽取 轉化 裝載 操作來將資料轉化為鍵值對形式。spark 為包含鍵值對型別的 rdd 提供了一些專有的操作。1.建立pair rdd val input sc.par...