很多棘手的問題都要借助原始碼才能解決,因為底層解釋的更詳細準確。
很多網際網路公司資深技術崗位的招聘要求上,「讀過至少一種開源框架的原始碼」赫然在列。這也就意味著,閱讀原始碼正在從「加分項」向「必選項」轉變,掌握優秀的框架**實現從nice-to-do 變成了 must-do。
作為一款優秀的訊息引擎,kafka的架構設計有很多為人稱道的地方,掌握了這些原理將極大地提公升我們自身的系統架構能力和**功力。可以借鑑其優秀的設計理念,提公升你在其他框架上的系統架構能力。
實際上,社群官方文件的內容有很大的提公升空間,kafka 有許多很棒的設計理念和特性,在文件中並未得到充分的闡述。我簡單舉個例子。kafka 中有個非常重要的概念:當前日誌段(active segment)。kafka 的很多元件(比如 logcleaner)是區別對待當前日誌段和非當前日誌段的。但是,kafka官網上幾乎完全沒有提過它。所以,單純依賴官網文件的話,肯定是無法深入了解 kafka 的。
實際上,你掌握的原始碼知識可以很好地指導實踐,幫助你快速地定位問題的原因,迅速找到相應的解決方案。
最重要的是,如果你對原始碼了然於心,你會很清楚線上環境的潛在問題,提前避「坑」。
在解決問題時,閱讀原始碼其實是事半功倍的「捷徑」。如果用時間成本來考量的話,你可以把閱讀原始碼的時間分攤到後續解決各種問題的時間上,你會發現,這本質上是一件划算的事情。
在社群中,你能夠和全世界的 kafka原始碼貢獻者協同工作,彼此分享交流,想想就是一件很有意思的事情。特別是當你的**被社群採納之後,全世界的 kafka使用者都會使用你寫的**。這簡直太讓人興奮了,不是嗎?
總而言之,閱讀原始碼的好處真的很多,既能精進**功力,又能錘煉架構技巧,還能高效地解決實際問題,有百利而無一害。kafka **有50 多萬行,為了避免從入門到放棄,用最高效的方式閱讀最核心的原始碼。
通常來說,閱讀大型專案的原始碼無外乎兩種方法。
總結:這兩種方法各有千秋,將兩者結合的方法其實是最高效的,即先弄明白最細小單位元件的用途,然後再把它們拼接組合起來,掌握元件組合之後的功能。(1)首先,你要確認最小單位的元件。
我主要是看 kafka 原始碼中的包結構(package structure),比如 controller、log、server 等,這些包基本上就是按照元件來劃分的。
(2)元件確定的優先順序順序是「log–>network–>controller–>server–>coordinator–>……」,畢竟,後面的元件會頻繁地呼叫前面的元件。
(3)可以試著切換成自上而下的方法,即從乙個大的功能點入手,再逐步深入到各個底層元件的原始碼。得益於前面的積累,你會對下沉過程中碰到的各層基礎**非常熟悉,
(4)關於如何選擇大的功能點,從 kafka 的命令列工具開始這種串聯學習,搞明白這個工具的每一步都是怎麼實現的,並且在向下鑽取的過程中不斷複習單個元件的原理,同時把這些元件結合在一起。
(5)隨著一遍遍地重複這個過程,會更清楚各個元件間的互動邏輯,成為乙個掌握原始碼的高手!
從功能上講,kafka 原始碼分為四大模組。
可以看到,伺服器端原始碼是理解 kafka 底層架構特別是系統執行原理的基礎,其他三個模組的原始碼都對它有著強烈的依賴。
因此,kafka 最最精華的**,當屬伺服器端**無疑!
————保持飢餓,保持學習
jackson_mvp
Kettle高階 Kitchen原始碼閱讀
源 路徑 org.pentaho.di.kitchen.kitchen kitchen是kettle用來啟動job的工具,使用者可以通過kitchen.sh指令碼執行job任務。現在我們來看kitchen是如何執行乙個job的。開啟kitchen原始碼進入main 方法我們首先看到其初始化了乙個ex...
《原始碼閱讀》原始碼閱讀技巧,原始碼閱讀工具
檢視某個類的完整繼承關係 選中類的名稱,然後按f4 quick type hierarchy quick type hierarchy可以顯示出類的繼承結構,包括它的父類和子類 supertype hierarchy supertype hierarchy可以顯示出類的繼承和實現結構,包括它的父類和...
原始碼閱讀 Glide原始碼閱讀之with方法(一)
前言 本篇基於4.8.0版本 原始碼閱讀 glide原始碼閱讀之with方法 一 原始碼閱讀 glide原始碼閱讀之load方法 二 原始碼閱讀 glide原始碼閱讀之into方法 三 大多數情況下,我們使用glide 就一句 但是這一句 裡面蘊含著成噸的 with方法有以下幾個過載方法 publi...