spark streaming任務觸發執行時間

相信有不少小夥伴在使用spark streaming做微批次處理的時候有過疑問，就是我設定了duration然後啟動任務，那麼我的批次任務每次會在啥時候啟動呢？相信對於duration設定比較小的同學來說並不會關心在什麼時候執行，但是對於duration設定比較大或者對資料延時、資源敏感的同學來說，可能就需要知道我的任務到底會在什麼時候出發執行，話不多說，我們直接看原始碼

進入github找到spark原始碼，鏈結spark streaming任務排程時間

private
[streaming]
object interval 
}

def floor
(that: duration)
: time =
def floor
(that: duration, zerotime: time)
: time =

通過上面兩段scala**可以看到，每個批次的開始時間是拿當前時間戳除以**設定的duration取整得到，也就是說，設定5分鐘duration，那麼觸發時間就會在05分、10分、15分、20分…這樣，想要調整觸發時間可以呼叫第二個函式設定zerotime實現。

spark streaming任務觸發執行時間

Spark Streaming入門詳解

Spark Streaming 程式監控

spark streaming讀取kafka示例

spark streaming任務觸發執行時間

Spark Streaming入門詳解

Spark Streaming 程式監控

spark streaming讀取kafka示例

相關推薦