Kafka MirrorMaker 跨集群同步工具

mirrormaker是kafka附帶的乙個用於在kafka集群之間製作映象資料的工具。該工具從源集群中消費並生產到目標群集。這種映象的常見用例是在另乙個資料中心提供副本。

圖1. mirrormaker

對於遷移的topic而言，topic名字一樣， partition數量可以不一樣，訊息的offset會不一樣。

1）whitelist和blacklist支援正規表示式。比如需要包含兩個topic可以這樣寫，--whitelist 'a|b' or --whitelist 'a,b' ，或者想遷移所有topic可以這樣寫 --whitelist '*'

2）注意在遷移之前建立好相關topic以及規劃好partition數量。

3）老版本和新版本遷移主要考慮consumer和producer的相容性

4）如果允許的話，建議將mirrormaker部署在目標集群內，這是因為如果一旦發生網路分割槽，消費者與源集群斷開連線比生產者與目標集群斷開連線要安全。如果消費者斷開連線，那麼只是當前讀取不到資料，但是資料仍然在源集群內，並不會丟失；而生產者斷開連線，mirrormaker便生產不了資料，如果mirrormaker本身處理不當，可能會丟失資料。

5）開始之前配置好限流，防止影響原來集群的正常工作。

1）檢測mirrormaker提交到源集群的位移。我們可以使用kafka-consumer-groups來檢測分割槽的最新位移以及mirrormaker提交的位移，通過計算差值得到落後間隔。

2）檢視ckafka的topic相關監控，檢視當前進度

Kafka MirrorMaker 跨集群同步工具

Elasticsearch 跨集群同步

使用Spark跨集群同步Hive資料

集群時間同步

Kafka MirrorMaker 跨集群同步工具

Elasticsearch 跨集群同步

使用Spark跨集群同步Hive資料

集群時間同步

相關推薦