/** 1.定義
* def aggregate[u: classtag](zerovalue: u)(seqop: (u, t) => u, combop: (u, u) => u): u
* seqop : 分區內聚合函式
* combop : 分區間聚合函式
* 2.功能
* 分割槽的資料通過初始值和分區內的資料進行聚合,然後再和初始值進行分區間的資料聚合
* 3.執行流程
* 1. 分區內對元素聚合
* seqop(zerovalue,e)
* 2. 拉取分割槽聚合的結果,在driver聚合
* combop(zerovalue,par_e)**
*/
object aggregatetest extendsval sc: sparkcontext = new
sparkcontext(sparkconf)
private val rdd: rdd[int] = sc.makerdd(list(8, 2, 4, 2), 2)
private val result: int = rdd.aggregate(0)(_ - _, _ -_)
println(result)
sc.stop()
}
Spark指南 第五章 Spark核心解析(1)
四 任務排程機制 五 訊息通訊原理 六 where to go spark核心泛指spark訊息通訊原理 作業執行原理 儲存原理 執行時架構 記憶體管理機制 任務排程機制等等。4.cluster manager 集群資源管理器 是指在集群上獲取資源的外部服務,目前有支援以下三種 standalone...
Python核心程式設計 第五章 數字
2011年 03月 06日 星期日 17 12 39 cst 1.數字提供了標量儲存和直接訪問。它是不可更改型別,也就是說變更數字的值會生成新的物件。2.python支援多種數字型別 整型 長整型 布林型 雙精度浮點型 十進位制浮點型和複數。3.python的長整型型別能表達的數值僅僅與你的機器支援...
《Windows核心程式設計》第五章 作業
include include include using namespace std typedef struct threadparam pthreadparam void monitorcompleteport lpvoid lpparam printf end thread success....