ELK 為什麼這麼流行? GIAC 訪談

2021-09-10 10:12:12 字數 2891 閱讀 9186

在大會前夕,高可用架構採訪了本屆大會講師曾勇,就目前業界非常流行的 elk 框架等問題進行了訪談。

曾勇(medcl),elastic 開發工程師與布道師,在分布式搜尋、高效能、高可用架構、自動化運維等方面積累了超過七年的經驗。elastic 開源社群負責人。

1、曾勇,您好,很榮幸能採訪到您。您作為 elastic stack 中國布道師,能否簡單分享一下您在 elk 布道過程中的收穫和感受?這個問題很好,首先作為布道師,首要任務就是讓更多的人了解我們的產品,鏈結社群和我們的開源產品,那自然而然就要接觸到更多的人,這個是我之前工作經驗中所不同的地方,收穫就是能夠聽到更多使用者的聲音,然後再反饋到我們的產品改進中。elastic 的產品一直在改進,我們一直在傾聽社群和客戶的聲音,使用者其實有很多訴求,功能,效能,可用性各方面,作為開源軟體廠商,這些也都必須要考慮到,elastic stack 最近剛發布了全新的 6.0 版本,比如就有新增了使用者經常反饋需要將搜尋結果匯出到 csv 的功能,還有對視覺障礙更加友好的顏色和對比度,完善的鍵盤導航支援,螢幕讀取文字轉語音等這些人性化功能。

2、elastic stack 總部在美國,很多讀者朋友很好奇您的工作方式是怎樣的?是遠端辦公嗎?兩地的時間差會不會導致溝通效率下降?

3、在大資料場景下,elk 一經推出就變得非常流行。elk 在大資料場景下有怎樣的定位?解決了使用者什麼樣的痛點?

elk 一推出,最開始是在運維圈子裡面火了起來,因為大家之前都沒有很好的工具來進行運維的日誌分析,elk 由三個產品組成,elasticsearch 負責海量資料的儲存和搜尋,logstash 負責各種來自各種資料來源的日誌採集,而 kibana 則很方便讓你快速進行分析,三個組合在一起,乙個完整的日誌分析的解決方案就有了,不用編寫一行**。隨著使用者的眾多,各種場景也被進一步挖掘出來,剛好最近幾年也是大資料比較火熱的時候,大家都在使用各種大資料的產品,然後發現 elasticsearch 就有處理海量資料的能力,幾十百 tb 也處理起來也很正常,並且比 hadoop 要更方便,速度更快。

4、提到大資料,就不得說 hadoop 生態圈。對比 hadoop 生態圈和 elk,您覺得它們各自有什麼樣的優勢和缺點?

還有乙個就是,elasticsearch 的速度 要快的多。elasticsearch 天然的索引支援,能夠在秒級甚至毫秒級別對海量的資料進行探索,這個是 hadoop 及之上的系統所遠遠達不到的。elasticsearch 同樣也支援海量的資料,目前上 pb 規模的使用者已有很多了,對於大部分的使用者,資料規模其實達不到真正意義的海量,所以使用 elasticsearch 完全就可以輕鬆解決大部分的場景需求,並且更加簡單。

elasticsearch 沒有提供 map reduce 這種可以進行更加靈活的資料操作,不能作為乙個任意的分布式計算平台,雖然也提供 script 支援,但是還是有一些侷限,這個是 elastic 設計的乙個權衡,支援的特性,必須速度第一。

其實還有很多區別,比如同樣都是分布式,elasticsearch 部署和運維要更加簡單等等。當然作為使用者來說,我覺得要看其具體需求,了解各自的適用場景然後再進行選擇。

5、作為 elk 的核心元件,elasticsearch 的最新版本已經是6.x,可謂發展迅猛。我很想知道,es 在快速發展的背後,有沒有踩過坑?或者有沒有讓您覺得有紀念意義的故事?

elasticsearch 發展很快,甚至大家都覺得有點太快而不適應,軟體公司發版都快趕上網際網路公司產品的發版了。

踩坑那是必然的,elastic 一路走來踩了不少坑,一開始引入了 type 這概念,產生了很多誤用引起的問題。對使用者造成的困擾和產品的使用影響都是巨大的,所以在 6.0 我們已經不支援多個 type 了,7.0 會完全移除。當然有很多值得紀念的里程碑的事件,第乙個要數廢棄 facts 和 aggregation 聚合的引入, 從此 elasticsearch 不單是乙個搜尋引擎,更是分析引擎,第二個,要算 doc values 的引入,更快、更少佔記憶體、同時更加穩定。在這次大會上也會介紹我們這一路走來的林林總總,歡迎關注。

6、從企業級分布式搜尋,到大資料應用場景,elk 有沒有在其他的熱門場景做一些探索?或者說它的下一步規劃是什麼?

elastic stack 除了分布式搜尋和大資料應用場景,在很多領域都有廣泛應用,比如 siem 領域,有很多公司用來進行安全方面的資料分析,做企業防入侵檢測、異常流量分析、使用者行為分析等。比如現在流行的 aiops,也有很多底層就是基於 elasticsearch的。 除此之外,還有很多拿來替換 zabbix、nagios 來做基礎設施監控,有一些公司是用來做業務指標分析。最近我們推出了 apm 的開源元件,未來應該會有很多公司用來進行應用效能分析。除了這幾個主要的熱門場景,其他的應用場景也真是五花八門。有用來做物聯網資料分析的,什麼電網使用量分析**。還有做基因資料分析的。有用來實時監測埃博拉疫情,疾控預防。輿情監控等等。太多了就不一一枚舉了。

7、作為 giac 大資料平台專題的講師,能否簡單透露一下您將要給聽眾帶來哪些值得期待的內容?

這次分享主要會介紹 elastic stack 各產品一路走來的架構演進和主要的變化。曾經遇到的問題和如何解決的。也會介紹一些典型的使用場景,方便大家發散思維。另外會對未來的產品的演進方向做乙個展望,總結過去、現在和未來,對我們產品感興趣、想知道拿來都能幹什麼以及以後將會怎麼樣,都可以過來了解一下。

8、最後,您對 giac 有什麼寄語或者期望?

本期 giac 大會上,大資料平台部分精彩的議題如下:

注:出品人及演講議題以最新官網為準,全部最新演講議題「閱讀原文」至官網檢視。

為什麼python比較流行

很多人覺得程式猿是高薪的代表,很多人都想學習一門程式語言,如果你想選擇一種語言來入門程式設計,那麼python絕對是首選!其非常接近自然語言,精簡了很多不必要的分號和括號,非常容易閱讀理解。接下來一起看看你不得不知的python六大優點 一 python的定位是 優雅 明確 簡單 所以python程...

我為什麼這麼累?

我為什麼這麼累?工作後,我常感到疲憊不堪,為此我的解釋是睡眠不足。可最近,看了一組資料之後才知道,我不是缺乏睡眠,而是工作過度 中國一共有12億人口,其中有三億退休,那就只剩下9億人工作了 8億人在農村,那就只剩下一億人在工作 二千萬是學生,那只剩下八千萬人在工作 這八千萬當中有四千萬是 工作人員,...

Redis為什麼這麼快?

今天我在乙個技術群裡提出乙個問題 redis為什麼這麼快,redis的那些特性能夠支援了它的高併發?之前的我,也只是知道redis是記憶體資料庫,所以讀取速度快 io使用的是多路復用,使用乙個執行緒來輪詢描述符,減少了執行緒上下文的切換,將資料庫的開 關 讀 寫都轉化成了時間,所以io時也有加速。雖...