kafka在高併發場景下的解決方案

在我們現在開發的專案中，經常會用到kafka訊息中介軟體。一般情況下，單執行緒（單分割槽）的配置已經可以滿足需求，但是在某些大資料和資料併發量要求較高的應用場景下經常會遇到訊息來不及處理，出現訊息積壓的情況。因此，該文章主要針對這種應用場景提供了乙個多執行緒消費的解決方案

自己在平時使用kafka訊息中介軟體的時候開始也並沒有分割槽的概念，都是像傳統的mq訊息中介軟體一樣，直接從topic裡消費訊息就行了。但是在有次專案現場發現有時候topic裡的訊息往往會積壓一部分無法消費。後來經過網上查閱資料和閱讀kafka官方文件，了解到可以使用kafka提供的多分割槽能力來解決這個問題。

官網上關於kafka的分割槽概念介紹很多，我這裡總結一下就是：

kafka的分割槽，相當於把乙個topic再細分成了多個通道，乙個消費者應用可以從乙個通道或者多個通道中獲取資料。例如：

生產者隨機分割槽提交資料

這也是乙個比較關鍵步驟，只有隨機提交到不同的分割槽，才能實現多分割槽消費；可以自定義自己的分割槽策略，如下：

public
intpartition
(string topic, object key,
byte
keybytes, object var,
byte
valuebytes, cluster cluster)
catch
(exception e)
return math.
abs(partitionsnum % numpartitions)
;}

然後在初始化kafka生產者配置的時候修改如下配置：

props.
put(
"partitioner.class"
,properties.
getproperty
(com.mykafka.mypartition)
);

這樣就實現了kafka生產者隨機分割槽提交資料。

消費者多執行緒消費資料

最後一步就是消費者，修改單執行緒模式為多執行緒，這裡的多執行緒實現方式有很多，這裡就以最簡單的固定執行緒模式：

executorservice fixedthreadpool = executors.
newfixedthreadpool(3
);for(
int i =
0; i <
3; i++)}
);}

在消費時需要注意，這裡得遍歷所有的分割槽，否則還是只消費了乙個分割槽：

consumerrecordsrecords = cosumer.poll(1000);
for (topicpartition partition : records.partitions())  else 
}}

注意上面的執行緒設定為固定的3個，因為這裡得跟上面kafka的分割槽個數相對應起來，否則如果執行緒超過了分割槽數量，那麼只會浪費執行緒，因為即使使用3個以上的執行緒也只會消費三個分割槽，而少了則無法消費完全。所以建議分割槽的數量和執行緒數設定為一致的。

通過上面的步驟，生產者和消費者就支援多分割槽和多執行緒的應用場景了。

需要注意的是，僅僅是消費者做了多執行緒用處不大的，必須生產者生產資料的時候將資料發到不同的分割槽才適用大的應用場景。否則也只是治標不治本的加快消費速度而已。

在實際使用過程中，也遇到了一些問題，比如生產者隨機分配資料到分割槽時，分配並不均勻。我在topic上設定了四個分割槽，壓測過程中，發現每個分割槽的資料量差別挺大的，極端的時候，只有乙個分割槽有資料，其餘三個分割槽空閒。解決方法就是在用生產者生產資料時，send方法需要指定key。kafka會根據key的值，通過一定的演算法，如hash，將資料平均的傳送到不同的分割槽上。

kafka在高併發場景下的解決方案

高併發業務場景下常見的解決方案

高併發場景下的限流策略

高併發場景下的請求合併

kafka在高併發場景下的解決方案

高併發業務場景下常見的解決方案

高併發場景下的限流策略

高併發場景下的請求合併

相關推薦