通過檢視官網:
根據官網介紹流處理平台具有三種特性:
可以讓你發布和訂閱流式的記錄。這一方面與訊息佇列或者企業訊息系統類似。
可以儲存流式的記錄,並且有較好的容錯性。
可以在流式記錄產生時就進行處理。
構造實時流資料管道,它可以在系統或應用之間可靠地獲取資料。 (相當於message queue)。
構建實時流式應用程式,對這些流資料進行轉換或者影響。 (就是流處理,通過kafka stream topic和topic之間內部進行變化)。
kafka
有四大核心api:the producer api、the consumer api、the streams api、the connector api。四大核心元件作用如下:
the producer api
允許乙個應用程式發布一串流式的資料到乙個或者多個kafka topic。
the consumer api
允許乙個應用程式訂閱乙個或多個 topic ,並且對發布給他們的流式資料進行處理。
the streams api
允許乙個應用程式作為乙個流處理器,消費乙個或者多個topic產生的輸入流,然後生產乙個輸出流到乙個或多個topic中去,在輸入輸出流中進行有效的轉換。
the connector api
允許構建並執行可重用的生產者或者消費者,將kafka topics連線到已存在的應用程式或者資料系統。比如,連線到乙個關係型資料庫,捕捉表(table)的所有變更內容。
核心api關係圖如下所示:
注:引自官網
kafka入門介紹
背景 當今社會各種應用系統諸如商業 社交 搜尋 瀏覽等像資訊工廠一樣不斷的生產出各種資訊,在大資料時代,我們面臨如下幾個挑戰 如何收集這些巨大的資訊 如何分析它 如何及時做到如上兩點 以上幾個挑戰形成了乙個業務需求模型,即生產者生產 produce 各種資訊,消費者消費 consume 處理分析 這...
kafka入門介紹
背景 當今社會各種應用系統諸如商業 社交 搜尋 瀏覽等像資訊工廠一樣不斷的生產出各種資訊,在大資料時代,我們面臨如下幾個挑戰 如何收集這些巨大的資訊 如何分析它 如何及時做到如上兩點 以上幾個挑戰形成了乙個業務需求模型,即生產者生產 produce 各種資訊,消費者消費 consume 處理分析 這...
kafka入門介紹
背景 當今社會各種應用系統諸如商業 社交 搜尋 瀏覽等像資訊工廠一樣不斷的生產出各種資訊,在大資料時代,我們面臨如下幾個挑戰 以上幾個挑戰形成了乙個業務需求模型,即生產者生產 produce 各種資訊,消費者消費 consume 處理分析 這些資訊,而在生產者與消費者之間,需要乙個溝通兩者的橋梁 訊...