關於自動化網路監控的真相

2021-09-23 08:43:58 字數 1353 閱讀 2903

每乙個人遇到的特定企業基礎架構設計在測量和實質上都有區別——唯一例外可能是你之前設計的網路加入了現在的公司;這些也是特殊的網路,當然不像當前的環境那樣特別。

就這一點而言,網路監控最佳實踐、通用技術和標準方法都無法適用,或者至少它們需要經過很大的修改,才能滿足你的it架構的特殊需求。

我發現這一點最貼切的莫過於系統監控工具。過去30年裡,我遇到了無數的組織機構,它們有各種不同的伺服器、應用程式、網路裝置等,而且與別人完全不同。

同時,他們的監控平台都是採用內部定製的技術而開發出來的,其中整合了許多複雜的軟體和硬體。它要求特殊的處理方法,需要由經過特殊培訓的系統管理員才能掌控,這些管理員都是linux領域的技術高手。

我覺得這就是:胡話!夢話!

在我30多年的it從業經歷裡,幾乎有20年都在關注監控領域——用過從2023年以來市場中每乙個重要的監控平台,支援環境小到幾台伺服器,大到包含全世界5,000個場所共250,000個系統。我可以負責任地告訴你一些中間親身遇到的事情。

真的嗎?是的,監控很簡單。

成功的監控是標準化的,但是它很有挑戰

是的,實現好的系統監控很簡單——監控要足夠穩定,能夠收集你需要的統計資料,同時不會產生偏差;監控要能夠提供有意義、可操作的警報,而不是產生雜訊;監控要能夠採取措施自動響應監控動作。它並不是什麼神秘術。它就像子網技術一樣標準化。然而,它並不輕鬆。監控是一項複雜任務,絕不輕鬆。 使監控變得複雜的其中乙個因素是自動化。許多it人員(甚至是專家)會說,自動化確實最好放在伺服器和應用程式領域裡。或者說,在網路領域實現自動化的唯一可行方法是勇於進入未知的sdn領域。

真相往往是最難得到的。

首先,我們可以這樣分析:監控並不是一張單據、乙個頁面或乙個螢幕而已。網路監控最佳實踐就是持續、定期和統一地從一系列裝置收集各種指標。只要你做完了第乙個部分,其他的東西——報表、警報、單據甚至自動化,都是唾手可得的副產品。 也就是說,好的自動化是源於好的監控(因果關係)。例如,如果你部署了很穩定的監控,那麼下面的任務就很輕鬆了: 定期收集網路裝置配置。 接收配置變化資訊。 從剛剛發出資訊的裝置上收集配置。 對比「上一次正常」配置與剛剛收集的配置。 如果確實出現差別,則強制回退到舊的配置,並且發出警報。 通過這種方式,未經正確變更控制而修改的裝置會強制回退回前乙個狀態,直到新的修改是認可的。隨便看乙份資料報告,你就可以知道這一類問題是40%-80%企業網路故障發生的根源。

它很簡潔、簡單,而且最重要的是它不是手工操作。它是自動化的,而且是合理的自動化。

網路裝置自動化還有其他一些例子,我以前也寫過一些,但是大多數公司實現監控的最大障礙並不是用錯工具或技能。主要問題是想法錯了——他們思維定勢地認為監控和自動很複雜、很難,認為這些事情一般人是做不好的。 最後,網路監控最佳實踐和自動化只是受到你想象力的限制,要突破思想束縛去實現乙個好的監控工具,而不要把精力浪費在一些無謂的事情上。

關於自動化網路監控的真相

在it領域,似乎一直有一種信條 你的企業的環境總是最特殊的。每乙個人遇到的特定企業基礎架構設計在測量和實質上都有區別 唯一例外可能是你之前設計的網路加入了現在的公司 這些也是特殊的網路,當然不像當前的環境那樣特別。就這一點而言,網路監控最佳實踐 通用技術和標準方法都無法適用,或者至少它們需要經過很大...

自動化測試 關於自動化元素抽取

為了能達到元素復用,以及後期維護的方便,按activity劃分,抽取每個activity常用的控制項到特定的類裡,是乙個比較好的方法 如下截圖所示,我用乙個包來存放各個activity要用到的控制項 看下contactpanelelements 這個類裡的內容 當我們要自動化某個用例的時候需要用到搜...

關於自動化測試

很多東西總是很容易被提起,然後接著被忘記 比如開發的單元測試,和測試的自動化測試。我覺得這個和企業的文化 開發測試團隊的流程化水平相關。如果我們在工作中已經 敏捷 掉了需求分析和詳細設計的時間,那麼我們是不可能忍受單元測試使用初期帶來的效率下降,也不可能堅持維護現有的單元測試指令碼。同樣如果測試組現...