第五章 Spark核心程式設計 Rdd 行動運算元

2022-10-09 06:39:13 字數 716 閱讀 8774

/*

* 1.定義

* def aggregate[u: classtag](zerovalue: u)(seqop: (u, t) => u, combop: (u, u) => u): u

* seqop : 分區內聚合函式

* combop : 分區間聚合函式

* 2.功能

* 分割槽的資料通過初始值和分區內的資料進行聚合,然後再和初始值進行分區間的資料聚合

* 3.執行流程

* 1. 分區內對元素聚合

* seqop(zerovalue,e)

* 2. 拉取分割槽聚合的結果,在driver聚合

* combop(zerovalue,par_e)**

*/

object aggregatetest extends

val sc: sparkcontext = new

sparkcontext(sparkconf)

private val rdd: rdd[int] = sc.makerdd(list(8, 2, 4, 2), 2)

private val result: int = rdd.aggregate(0)(_ - _, _ -_)

println(result)

sc.stop()

}

Spark指南 第五章 Spark核心解析(1)

四 任務排程機制 五 訊息通訊原理 六 where to go spark核心泛指spark訊息通訊原理 作業執行原理 儲存原理 執行時架構 記憶體管理機制 任務排程機制等等。4.cluster manager 集群資源管理器 是指在集群上獲取資源的外部服務,目前有支援以下三種 standalone...

Python核心程式設計 第五章 數字

2011年 03月 06日 星期日 17 12 39 cst 1.數字提供了標量儲存和直接訪問。它是不可更改型別,也就是說變更數字的值會生成新的物件。2.python支援多種數字型別 整型 長整型 布林型 雙精度浮點型 十進位制浮點型和複數。3.python的長整型型別能表達的數值僅僅與你的機器支援...

《Windows核心程式設計》第五章 作業

include include include using namespace std typedef struct threadparam pthreadparam void monitorcompleteport lpvoid lpparam printf end thread success....