美團效能優化之路 效能指標體系

2021-08-19 06:46:56 字數 1565 閱讀 7803

而在美團,「消費者第一」是公司的第一價值觀,為了給消費者提供更好的使用者體驗,美團網的技術geeker們在效能優化的路上做了不少的工作,開發了許多任務具讓**的效能監測更容易,通過各種視覺化報表,工程師們只需要點點滑鼠就能看到**的效能資料,並能根據資料來**系統的效能趨勢,快速發現有價值的優化點。在本文中,不講best practices,也不去講具體的優化手段,僅從美團日常通用的效能指標體系的角度去分享美團的實踐。

為了更好的去監控整個系統的效能,做好全流程的優化,美團將指標分為了以下3類:

對於上述的每一類,衡量標準可能都不一樣,在資料展示方面,主要通過趨勢圖和彙總**來展現,下面來對這3類指標分別細說:

##perceived system performance

這類指標主要為工程師設計,來衡量業務後端的處理速度,主要從以下幾個方面去衡量:

1) 響應時間

在美團,響應時間是效能的主要kpi,對於響應時間,美團做了很多精細化的處理;

首先對每個業務的整體(集群)響應時間有個衡量:

以某內部服務為例,3條不同的曲線分別代表了3種不同的響應時間維度:

另外為了方便工程師的優化,對具體到每個請求url都做了更精細化的統計,不光統計了上述的指標,還增加了:

時間標準差:某請求某段時間範圍內的波動情況,用來衡量某請求是否存在很大波動,標準差越大,波動越大。

以某內部服務為例,通過彙總**展現出某小時的某url的更細響應時間的維度:

2)請求數(按天或小時統計)

根據不同的時間維度去統計系統每天或每小時的請求數(每小時的統計情況可以見上圖),並以趨勢圖和**形式展示。

某內部服務每天請求數的趨勢圖:

3)錯誤率

關於錯誤率的統計主要有以下幾種:

以某內部服務的異常數量趨勢為例:

##perceived user experience

這類指標從使用者的角度出發,通過模擬使用者請求或對真實使用者抽樣,來監控使用者對**的實際體驗效果,主要利用js來收集不同瀏覽器下訪問**的載入速度和效能;對於一次完整使用者請求來說,http請求可以劃分為如下幾個階段:

對於上述的幾個階段,我們設立了多種時間引數(每個引數又有 90% 和 50% 兩種指標)來衡量,具體如下:

為了更清楚的說明每個引數的意義,用下圖說明如下:

其中不同的指標對於使用者體驗的影響權重不同,對於使用者來說白屏時間(瀏覽最開始時刻到首屏載入前)和首屏時間是最重要的。

某應用的上述時間引數趨勢圖:

##system performance

這類指標主要監測目前伺服器的cpu,記憶體,硬碟io率,網路頻寬,流量等等物理資源的使用情況,這類指標比較常見,就不細說了。

某內部服務的cpu使用率情況:

某內部服務的硬碟io情況:

某內部服務的網路io情況:

#總結俗話說「軍馬未動,糧草先行!」,監控->分析->優化,號稱是效能優化的三部曲,為了更容易地找到效能優化的關鍵點,建立乙個統一的精細化的效能監控平台,做到資料驅動型的效能優化,是公司的長遠目標,也是值得公司投入的乙個方向,效能優化,從監控開始,只有監控的效能指標體系建立好了,才能更好地去做分析和優化!(ps:歡迎對效能優化感興趣的童鞋加入美團。)

效能指標體系構建

前言 在這唯快不破的網際網路世界中,快 響應速度 成為良好體驗的乙個重要因素。那麼如何量化響應速度哪?效能指標的分類 為了更好的去監控整個系統的效能,做好全流程的優化,將指標分為了以下3類 對於上述的每一類,衡量標準可能都不一樣,在資料展示方面,主要通過趨勢圖和彙總 來展現,下面來對這3類指標分別細...

Jmeter 效能測試 效能指標

一 效能測試關注的重要指標,包括 1.系統資源指標 1 cpu佔用率 2 記憶體佔用率 3 io 4 頻寬 2.系統指標 1 併發使用者數 2 tps 每秒鐘處理的請求數 3 響應時間 4 事務成功率 5 超時錯誤率 二 效能測試需要注意的事項 1 測試環境要和線上的真實環境一樣,包括配置 集群方式...

效能測試 效能指標 1

一 效能測試的指標 相應時間 併發使用者數 吞吐量系統效能計數器 思考時間 總結 多快好省 多 併發量,快 響應時間,好 穩定性,長時間執行,省 資源使用率 思考時間 二 響應時間 對請求作出響應所需要的時間,是使用者感知的軟體效能的主要指標 響應時間包括 端到端 1 使用者客戶端呈現的時候 2 請...