全鏈路壓測是保障業務穩定性,使用者體驗的重要手段,從巨集觀角度,我覺得全鏈路壓測的作用和意義可以抽象為3個: 發現問題,定位和止損問題,預見問題。
發現問題
如何有效識別線上問題?
現有的流程能夠保證開發環節, 整合環節,預發灰度,線上; 由於真實的線上環境往往很複雜, 經常發生的乙個問題是我們在現在測試,功能,效能等等, 線上還是出現問題。
全鏈路壓測解題的角度是「真實的使用者場景」和「真實的線上環境」。
線上無小事,直接針對線上必然會有一定風險,圍繞這個問題,需要解決幾個問題:
a. 資料構造 ,如何構造真實線上流量,引流,回放;(當然過程中很多問題需要解決,如何設定介面比例,
b. 流量識別 ,針對不同中介軟體標記壓測流量,http, rpc, mq等如何識別壓測流量;
c. 資料隔離 ,不汙染線上資料,如儲存、快取、訊息、日誌等;
d. 施壓環境 ,併發控制,請求效率,基於jmeter的bio,還是gatling的nio,抑或是自己封裝的io模型, 不同的機房, 不同的cdn;
e. 第三方服務依賴 。
定位和止損問題
從工程效率的角度, 全鏈路壓測需從業務要對線上業務非常了解,從專業性的角度,需要對壓測有很強的專業能力。如何快速識別異常指標,
a. 指標 ,iops, 吞吐量,響應時間,延時,使用率,飽和度,瓶頸,工作負載,快取。
b. 鏈路 ,鏈路診斷,瓶頸等;
c. performance tuning , use(utlization、saturation、error)方法, 工作負載特徵歸納、快取,資料庫等各種調優,等等;
d. 熔斷,降級,限流,開關等策略 ;
e. 報告 。
預見問題
不在同乙個坑摔倒兩次,如果預見未知的問題, 如果基於已有的問題預見未來可能的問題, 進而提公升線上運維,能力。
a. 容量規劃 , 資源極限,因素分析,負載均衡,分片等;
b. 架構調優;
c. 故障演練。
其他 - 權衡三角
考慮當前團隊所處的的狀態,先僵化、後優化、再固化,還是那兩個字「權衡」。
聊聊全鏈路壓測
之前有和認識的同行聊過他們全鏈路壓測的一些技術實現方案,自己也看了很多相關的資料,這篇部落格,說說自己對全鏈路壓測的理解,以及整理的一些知識點。ps 主要羅列的是問題點,以及對應的一些解決方案,僅供參考。阿里全鏈路壓測 有讚全鏈路壓測 京東全鏈路壓測 餓了麼全鏈路壓測 滴滴全鏈路壓測解決之道 美團全...
全鏈路壓測
2013年為了雙11提前預演而誕生,該服務已提供在阿里雲pts鉑金版。1.1.1 系統可用性問題 經常由下面一些不確定性因素引起 1.1.2 傳統線上單機與單系統壓測的四種方式 從流量分配的角度,將流量集中到某台機器 這兩種方式要求訪問流量不能太小 1.1.3 單系統壓測的問題單鏈路指乙個業務線。全...
全鏈路壓測
之前有和認識的同行聊過他們全鏈路壓測的一些技術實現方案,自己也看了很多相關的資料,這篇部落格,說說自己對全鏈路壓測的理解,以及整理的一些知識點。阿里全鏈路壓測 有讚全鏈路壓測 京東全鏈路壓測 餓了麼全鏈路壓測 一 什麼是全鏈路壓測 基於實際的生產業務場景 系統環境,模擬海量的使用者請求和資料對整個業...