【編者按】本文作者為 sahil khanna,文中介紹了現代企業常用的監控工具與模式,同時指出了其中的不足,以及更為完善的解決方案。本文系 oneapm 工程師編譯整理。
我還喜歡問的第二個問題是——「你是怎樣把各個監控工具裡獲得的資訊聯絡起來的?」 從他們的回答中我發現兩個共同點,分別與傳統企業和數位化企業的監控配置有關,而且這兩個共同點解釋了乙個更加嚴重的問題——為什麼客戶總是比監控工具更早地發現問題。
我說的「傳統企業」,主要是指金融服務、管理服務**商、製造業、電信公司和聯邦等企業組織。雖然你在看這篇文章的時候,它們可能正在經歷重大的數位化轉型,但是這些企業的 it 環境、流程和許多任務具實在是太「傳統」了,因為它們的工具基本上都購買於上個世紀末和本世紀初,當時 ibm、hp 和 ca 等 mom **商為運營管理整合了企業級套裝。這些套裝從概念上而言在當時很先進,但實際上只是各種不同層級的工具整合的「大雜燴」。它們可以執行基礎的降噪和事件關聯,但是是通過基於規則的方式進行的,也就是說,你必須在問題發生前就**到這個問題。可以想象這種要求會產生怎樣的後果。而且,這些套裝還很難配置和管理,要想使它們正常工作,還得再投入幾百萬美元和幾百個工時。
現在,轉眼到了 2016 年,這些工具依舊是傳統企業的核心 it 管理層,究其原因,是由「廠商鎖定」這個堪稱天才的商業策略導致的。雖然傳統企業已經認識到新一代監控工具的價值,也花了巨資購買最好的工具集來提公升服務質量。但是,與這些企業的it運維團隊交流時,我發現他們顯然沒有充分利用各個工具,而只是將一部分事件流傳送至 ibm netcool 或 ca spectrum 之類的工具中供運維團隊檢視。他們被迫使用很小一部分事件,只能獲得有限的可見性,因為遺留 mom 沒有以下功能:
1)擴充套件
2)整合新工具(沒有標準的 api)
3)自動適應基礎設施更改(需要手動建立或維護規則)
下圖是我最近交流過的乙個大型傳統企業的監控圖示。
他們有40多種監控工具、1000 多個應用程式,每天生成約 200,000 個事件。他們使用 ca spectrum 作為頂層管理系統,但是由於可擴充套件性和整合的限制,spectrum 每天只能從 splunk、keynote 和solarwinds 接收約 30,000 個事件。也就是說,事件覆蓋率只有 15%!那這樣的配置是怎樣為他們工作的呢?好吧,對此他們表示,只有 7% 至9% 的事件是工具檢測出來的,其他的都是客戶發現的。你可以想像這些企業面臨過多少次 sla 違規、收入損失以及與日俱增的 it 成本問題。
要想更深入地了解和解決這個問題,推薦閱讀 intellyx 的傑森•彭博寫的「受夠了遺留監控工具?該換成可組合的 it 監控了!」。
我交流過的數位化企業為了滿足自身獨特的需求,通常都構建了乙個龐大且最好的監控生態系統,但是卻沒有管理層將系統結合起來,現在他們開始感受到以下問題的痛苦了:
1. 沒有重複資料刪除功能。可能你覺得刪除重複資料不重要,但是你得明白,即使事件總量只減少 25%,運維團隊的檢視量也會減少 25%。這就大大減少了工作量,顯著提高了生產力。
2. 沒有關聯功能。如果沒有乙個工具自動告訴你,有兩個或多個事件實際上與同乙個問題相關,那麼你可能會讓不同的團隊獨自研究同乙個問題,因而浪費了寶貴的時間。
雖然 ibm、ca、bmc 和 hp 的遺留工具需要繁重的人工勞動才能實現這些功能,但是沒有管理層的數位化企業則完全與關聯功能帶來的益處失之交臂。
據我所見,數位化企業普遍使用電子郵件充當管理控制工具。下圖是我曾交流過的一家數位化企業的監控示意圖。
該企業使用電子郵件作為**事件管理控制台。由於他們的支援團隊很小,於是決定每天只傳送來自 siteconfidence sythetics 的 500個事件,至於其他事件則全部忽略。這家數位化企業每天生成約 40,000 個事件,也就是說,他們只檢視了約1%的事件。支援團隊會仔細檢視最關鍵的事件,人工刪除重複資料並關聯事件或告警,然後再適當地挖掘其他工具。但是這個過程極度耗費人力,而且又相當低效,最為嚴重的是,他們缺乏對整個 it 環境的可見性。當被問到他們的監控工具是怎樣發現問題的時候,他們告訴我「大多數」事件都是客戶而不是工具發現的。
在某些特定情況下,有些公司已經形成了自己的管理解決方案,但是我很少聽到它們的負責人表示對服務質量有絕對的把握。
次時代資料監控與管理工具,如 oneapm cloudinsight 產品,可以幫助創業企業、服務提供商等實現最好的it基礎元件與其他資料監控,每天處理數十億事件,以獲得整個 it 環境的完全可見性。從本質上而言,次時代監控管理工具可以實現一體化監控與管理,可以讓你通過標籤管理任意資料,機器,從而確保最優的服務質量和效能。
本文** oneapm 官方部落格
為什麼現代企業無法真正實現組合式監控?
編者按 本文作者為 sahil khanna,文中介紹了現代企業常用的監控工具與模式,同時指出了其中的不足,以及更為完善的解決方案。本文系 oneapm 工程師編譯整理。我還喜歡問的第二個問題是 你是怎樣把各個監控工具裡獲得的資訊聯絡起來的?從他們的回答中我發現兩個共同點,分別與傳統企業和數位化企業...
為什麼現代企業需提高企業敏捷性
時至今日,當我想到現代商業實踐,定會浮現三個關鍵要素,這三個要素可為企業帶來強大的競爭優勢 1 保證業務的全面可視性。2 將業務可視性轉化為實時資料,讓企業就應如何利用有限資源做出明智決策。3 精簡業務,加速產品開發並縮短產品面市時間。公平地講,當下所說的實施現代商業實踐,基本上等同於我們常提到的 ...
為什麼無法訪問mysql mysql為什麼無法訪問
mysql無法訪問有兩種情況 乙個是mysql沒有分配許可權,使用grant語句分配訪問許可權即可格式 grant 許可權 on 資料庫名.表名 使用者 登入主機 identified by 使用者密碼 grant select,update,insert,delete on to zhxia id...