訊息佇列也叫 mq(message queue)。kafka作為訊息佇列中的優秀平台,被很多公司使用,是一種高吞吐量的分布式發布訂閱訊息系統,本篇給大家總結了27道kafka知識點或者說面試題,持續更新中。。。1.什麼是kafka?
apache kafka是由apache開發的一種發布訂閱訊息系統。
2.kafka的3個關鍵功能?
3.kafka通常用於兩大類應用?
4.kafka特性?
訊息持久化
高吞吐量
擴充套件性多客戶端支援
kafka streams
安全機制
資料備份
輕量級訊息壓縮
5.kafka的5個核心api?
6.什麼是broker(**)?
kafka集群中,乙個kafka例項被稱為乙個**(broker)節點。
7.什麼是producer(生產者)?
訊息的生產者被稱為producer。
producer將訊息傳送到集群指定的主題中儲存,同時也自定義演算法決定將訊息記錄傳送到哪個分割槽?
8.什麼是consumer(消費者)?
訊息的消費者,從kafka集群中指定的主題讀取訊息。
9.什麼是topic(主題)?
主題,kafka通過不同的主題卻分不同的業務型別的訊息記錄。
10.什麼是partition(分割槽)?
每乙個topic可以有乙個或者多個分割槽(partition)。
11.分割槽和**節點的關係?
乙個分割槽只對應乙個broker,乙個broker可以管理多個分割槽。
12.什麼是副本(replication)?
每個主題在建立時會要求制定它的副本數(預設1)。
13.什麼是記錄(record)?
實際寫入到kafka集群並且可以被消費者讀取的資料。
每條記錄包含乙個鍵、值和時間戳。
14.kafka適合哪些場景?
日誌收集、訊息系統、活動追蹤、運營指標、流式處理、時間源等。
15.kafka磁碟選用上?
ssd的效能比普通的磁碟好,這個大家都知道,實際中我們用普通磁碟即可。它使用的方式多是順序讀寫操作,一定程度上規避了機械磁碟最大的劣勢,即隨機讀寫操作慢,因此ssd的沒有太大優勢。
16.使用raid的優勢?
17.磁碟容量規劃需要考慮到幾個因素?
18.broker使用單個?多個檔案目錄路徑引數?
log.dirs 多個
log.dir 單個
19.一般來說選擇哪個引數配置路徑?好處?
log.dirs
好處:提公升讀寫效能,多塊物理磁碟同時讀寫高吞吐。
故障轉移。一塊磁碟掛了轉移到另乙個上。
20.自動建立主題的相關引數是?
auto.create.topics.enable
21.解決kafka訊息丟失問題?
22.如何自定分割槽策略?
顯式地配置生產者端的引數partitioner.class
引數為你實現類的 全限定類名,一般來說實現partition方法即可。
23.kafka壓縮訊息可能發生的地方?
producer 、broker。
24.kafka訊息重複問題?
做好冪等。
資料庫方面可以(唯一鍵和主鍵)避免重複。
在業務上做控制。
25.你知道的kafka監控工具?
26.kafka系統支援兩種不同傳送方式?
非同步模式
同步模式
27.消費者和消費者組區別?
乙個消費者組,可以有乙個或者多個消費者程式。
消費者組名(groupid)一般由具有唯一性字串表示。
如果乙個消費者組訂閱了主題,則該主題每個分割槽只能分配給某乙個消費者組中的某乙個消費者程式。
參考:
三道面試題
一 給定乙個n個整數元素的陣列,元素分別為a1,a2,a3.an,每個元素分別對應乙個權重w1 小於1的float w2,w3.wn,其和為1,找出其中乙個元素ak,使所有小於ak的元素的權重之和小於1 2,所有大於ak的元素的權重之和 1 2。思路 首先將該陣列按元素值的大小進行公升序排列,同樣的...
大資料面試題 八 Kafka面試題
無意中發現了乙個巨牛的人工智慧教程,忍不住分享一下給大家。教程不僅是零基礎,通俗易懂,而且非常風趣幽默,像看 一樣!覺得太牛了,所以分享給大家。點這裡可以跳轉到教程。大資料面試寶典目錄,1.請說明什麼是apache kafka?2.請說明什麼是傳統的訊息傳遞方法?3.請說明kafka 相對於傳統的訊...
ios 基礎面試題前10道
1 import與 include的區別,class代表什麼?答 import比起 include的好處就是不會引起交叉編譯。在 oc中 import 被當成 include 指令的改良版本來使用。除此之外,import 確定乙個檔案只能被匯入一次,這使你在遞迴包含中不會出現問題。一般來說,在匯入 ...