Storm學習筆記(一) 實時流式計算概述

2021-09-13 16:55:12 字數 746 閱讀 1055

下面主要通過如下4個問題來闡述什麼是實時流式計算:

1.什麼是實時流式計算?

流式計算:在不斷產⽣的資料流上的計算

實時流式計算:在不斷產⽣的資料流上的實時計算

2.⼤資料背景下有哪些特點?

時效性⾼:很快得到結果

⾼吞吐:應對⼤量的流量單機往往搞不定

容錯性:需要對⺴絡、機器、程序各種異常提供容錯機制

靈活性:能快速根據需求增減處理邏輯

3.適合什麼樣的業務場景?

實時etl

持續計算

4.有哪些關鍵技術點?

在大資料鄰域我們常用的實時計算框架如下所示:

常見系統

架構程式設計模型

資料傳輸

高可用性

可維護性

spark streaming

spark

rddshuffle

wal好

storm

nimbus

supervisor

worker

dag

spout

bolt

zmq/netty

異常處理

訊息可靠性

保證機制

spark streaming 與 storm 的對比

storm與sparkstreaming的區別?

storm與spark streaming比較

Storm流式處理框架第二期 Storm計算模型

對於 storm 實時計算邏輯的封裝,即,由一系列通過資料流相互關聯的spout bolt 所組成的拓撲結構。生命週期 此拓撲只要啟動就會一直在集群中執行,直到手動將其 kill 否則不會終止 區別於mapreduce 當中的job,mr 當中的job 在計算執行完成就會終止 stream 中最小資...

storm學習筆記(一)

1 storm介紹 storm特點 storm保障每個訊息至少能得到一次完整處理。任務失敗時,它會負責從訊息源重試訊息 系統的設計保證了訊息能夠得到快速的處理,使用 mq作為其底層訊息佇列 2 總體架構 storm中涉及的術語 3 storm在zookeeper中的資料存貯及使用 1 存貯 stor...

學習Storm實時計算框架

storm是乙個分布式是實時計算系統,它設計了一種對流和計算的抽象,概念比較簡單,實際程式設計開發起來相對容易。storm中最核心的計算元件的抽象就是spout bolt,以及stream grouping。名詞 含義拓展 topology 拓撲圖類似於hadoop中的mapreduce job,是...