kafka的本質是乙個mq訊息佇列。
kafka應用面比較廣,是乙個中介軟體
a和b系統需要通訊,不會直接連線,中間有個中介軟體進行對接。
kafka比flume複雜一點。
kafka需要搭建集群,但是flume不需要
其次,kafka需要依賴zk,flume不需要。
什麼是訊息佇列?
kafka是做什麼的?
kafka的安裝。
kafka的架構,從細節中去了解,發現kafka和flume很像。
kafka的api,非常的重要,在生產環境中主要通過api去操作kafka,而不是說在命令列,命令列裡面主要是對元資料進行增刪改查。
kafka的監控。
flume對接kafka:
kafka的面試題:
後面做的數倉專案:需要把每個框架去複習。
整體的課程介紹:重點在於
kafka的架構,關於原理的東西(面試)
kafka的api:在工作中使用到(開發)
Kafka入坑指南
kafka是為大資料而生的訊息中介軟體,以其百萬級tps的吞吐量名聲大噪,迅速成為大資料領域的寵兒,在資料採集 傳輸 儲存的過程中發揮著舉足輕重的作用,而storm,spark,flink等大資料流處理或批處理平台都有kafka的相關外掛程式支援。本著為開源做貢獻的原則,在學習kafka的同時也參與...
flume實現kafka的實時訊息入hdfs
1 這裡先啟動hdfs,並在hdfs儲存路徑中新建乙個目錄 flume 準備存放flume收集的kafka訊息。sbin start dfs.sh2 然後啟動kafka服務,並建立乙個topic flume data 然後還可以啟動乙個生產者控制台,準備往flume data這個topic中生產訊息...
任務3 03 Kafka入門 訊息佇列
非同步 約定時間,兩天後再來取,我自己做我自己的事情,不耽誤。使用訊息佇列的好處 1 解耦。關鍵好處 2 可恢復性。系統一部分失效之後,不會影響到整個系統。3 緩衝。主要解決生產大於消費的問題。使用者比較少,伺服器是乙個1000臺的集群,這時候就不需要訊息佇列了,直連也可以解決。如果使用者很多,每天...