dynatrace用problem(問題)表示異常情況,即偏離了正常行為或狀態。例如某個服務速度變慢或某個使用者登入應用速度變慢。每當檢測到問題時,dynatrace都會引發乙個特定的problem event(問題事件)來表示此類異常。
請注意,您環境中新檢測到的異常事件並不一定會立即引發乙個新的問題(problem)。dynatrace丟擲的問題(problem)通常帶有根本原因分析。為了確定問題的根本原因,dynatrace採用了一種上下文感知的方法來檢測一系列相互依賴的事件。dynatrace會去分析相應時間段內涉及到的所有主機,所有程序,所有服務,所有應用程式以及他們之間縱向橫向的依賴關係。只有通過這種上下文感知的方法,才最可能查明問題發生的真正根本原因。
為了確定在什麼時間點產生新problem event(問題事件)更合理,dynatrace 會根據定義的閾值連續不停地評估傳入的資料。通過這種方法來保證生成準確的響應時間退化和錯誤率上公升的新problem event(問題事件)。對於應用和服務來說,急速的響應時間退化是根據5分鐘時間段來評估的,慢速的響應時間退化是根據15分鐘時間段來評估。
dynatrace使用兩種型別的閾值:
自動基線:
多維度基線自動檢測隨時間變化的各個參考值。自動基線參考值用於應對應用程式或服務「響應時間」,「錯誤率」和「交易量」中的動態變化。
內建靜態閾值:
基於自動基線觸發事件的機制與基於靜態閾值完全不同。靜態閾值提供了一種簡單明瞭的方法,不需要學習時間就可以立即工作。但是,由於以下缺點,這種方法是不明智的:
請注意,dynatrace允許您通過調整靜態閾值或偏離自動基線值來調整問題檢測的敏感性。
檢測到問題後,您可以在問題的概述頁面上直接分析其後果。dynatrace提供了直接影響分析和業務影響分析的功能。另外,在問題的概述頁面上,您可以分析問題的根本原因。
為了確定問題的根本原因,dynatrace不僅依賴於時間相關性,還遵循上下文感知的方法來檢測跨時間,程序,主機,服務,應用程式以及在垂直和水平拓撲監控視角中相互依賴的事件。
下面是乙個問題(problem)的示意圖,該問題的根本原因是基礎結構層中的效能事件。
dynatrace檢測到基礎結構級別的效能事件。將建立乙個新問題以進行跟蹤,並通過dynatrace移動應用程式傳送通知。
幾分鐘後,基礎結構問題導致應用程式服務之一出現效能下降問題。
其他服務級別的效能下降問題開始出現。因此,最初從乙個孤立的僅基礎架構的問題開始,已經發展成為一系列服務級別的問題,每個問題的根本原因都在於基礎結構層的原始事件。
最終,服務級別的問題開始影響通過桌面或移動瀏覽器與您的應用程式進行互動的客戶的使用者體驗。在問題生命週期的這乙個時間點上,您遇到了乙個應用程式問題,其中乙個根本原因在基礎架構層,而另乙個根本原因在服務層。
因為dynatrace可以了解您環境中的所有依賴關係,所以可以將客戶遇到的效能下降問題與基礎結構層中的原始效能問題相關聯,從而有助於快速解決問題。
在檢測到異常後,dynatrace可以生成告警,以通知負責人員出現的問題。dynatrace允許您根據嚴重性,客戶影響,關聯的標籤或檢測到的問題的持續時間來設定細粒度的警報過濾規則。這些規則實際上使您可以定義警報配置檔案。通過警報配置檔案,您還可以與第三方訊息系統(如slack,hipchat和pagerduty)建立過濾後的問題通知整合。
OA系列(二) 發展歷程
雖然國內的oa產商非常之多,但並沒有多少公司去詳細研究oa本身的一些特性。比如 它是什麼時候出現的 什麼時候成熟的 它又是怎樣出現的呢等問題。我從網上找了很久,沒有發現答案,只看到一些xxoa的十大優勢 xxoa的理念等。oa在國內的發展歷程可以追溯到90年代初期,從m 的windows95出現後,...
webpack4系列第四發
在webpack4中的hmr配置及其簡單,如下所示即可 const webpack require webpack module.exports src index.js 入口檔案 import style.css 這樣當我們的css檔案更新的時候,就會自動替換所更新的。需要注意的是,這裡css的自...
如何使用git 發patch
多發patch,多產生一些好的 idea,才可以在open software community中越混越好。首先配置git。這裡有兩種配置檔案,乙個是全域性的,在使用者的home目錄下,乙個是相應git倉庫的。如果你設定了全域性的,那麼可以用在各個git倉庫上。檢視一下我已經配置好的配置檔案 hac...