監控批次處理時間,若超過閾值則告警,每次告警間隔2分鐘
class
sparkstreamingdelaylistener
(private val duration: int,
private val times: int)
extends
streaminglistener
//若批次處理延遲大於批次時長指定倍數,並且告警間隔大約2分鐘,則告警
if(totaldelay.get >= times * duration *
1000
&& flag)
}}
ssc.
addstreaminglistener
(new
sparkstreamingdelaylistener
("userid2redis"
, duration,times)
)
大資料 Spark(八)
dag directed acyclic graph 叫做有向無環圖 有方向,無閉環,代表著資料的流向 原始的rdd通過一系列的轉換就形成了dag。下圖是基於單詞統計邏輯得到的dag有向無環圖 乙個job會被拆分為多組task,每組任務被稱為乙個stage。stage表示不同的排程階段,乙個spar...
大資料框架 spark
rdd 彈性分布式資料集。operation transformation 和action,乙個返回rdd,乙個返回值。lineage rdd之間的依賴關係,如何演變過來。partition rdd分割槽,按block切分 narrow dependency 窄依賴 父rdd全進入子rdd wide...
大資料篇 Spark安裝及測試PI的值
關於hadoop的安裝,這裡就不概述了!spark部署模式主要有四種 local模式 單機模式 standalone模式 使用spark自帶的簡單集群管理器 yarn模式 使用yarn作為集群管理器 和mesos模式 使用mesos作為集群管理器 這裡介紹local模式 單機模式 的 spark安裝...