大資料面試 Spark篇(二)

2021-10-07 16:13:31 字數 500 閱讀 1638

監控批次處理時間,若超過閾值則告警,每次告警間隔2分鐘

class

sparkstreamingdelaylistener

(private val duration: int,

private val times: int)

extends

streaminglistener

//若批次處理延遲大於批次時長指定倍數,並且告警間隔大約2分鐘,則告警

if(totaldelay.get >= times * duration *

1000

&& flag)

}}

ssc.

addstreaminglistener

(new

sparkstreamingdelaylistener

("userid2redis"

, duration,times)

)

大資料 Spark(八)

dag directed acyclic graph 叫做有向無環圖 有方向,無閉環,代表著資料的流向 原始的rdd通過一系列的轉換就形成了dag。下圖是基於單詞統計邏輯得到的dag有向無環圖 乙個job會被拆分為多組task,每組任務被稱為乙個stage。stage表示不同的排程階段,乙個spar...

大資料框架 spark

rdd 彈性分布式資料集。operation transformation 和action,乙個返回rdd,乙個返回值。lineage rdd之間的依賴關係,如何演變過來。partition rdd分割槽,按block切分 narrow dependency 窄依賴 父rdd全進入子rdd wide...

大資料篇 Spark安裝及測試PI的值

關於hadoop的安裝,這裡就不概述了!spark部署模式主要有四種 local模式 單機模式 standalone模式 使用spark自帶的簡單集群管理器 yarn模式 使用yarn作為集群管理器 和mesos模式 使用mesos作為集群管理器 這裡介紹local模式 單機模式 的 spark安裝...