隨著資訊化建設的迅速發展,為了更好的、有效的保障系統上線後穩定高效執行,在上線前都會對其服務端進行各種壓力測試,例如單交易負載測試、混合綜合場景壓力測試、穩定性測試、浪湧測試、端到端非功能測試等全鏈路非功能性測試,目的是為了在上線把各種懷疑性技術性問題等排查清楚。因此在最基本的全鏈路非功測試過程中,對於伺服器的資源使用情況、頻寬、網路、磁碟、程序、資料或日誌儲存檔案目錄使用情況等進行可靠和可持續的監控,統計分析在壓力測試過程中的各種資料,從而能及時發現問題原因,並快速定位解決。例如資料庫的資料量大、cpu高、io高等等而做為非功能測試人員在做壓力測試過程中最希望能使用乙個簡易而且直觀的、集中、統
一、自動監控工具來協助我們快速定位分析和對歷史資料的對比。如netdata。netdata是一款輕量級的適用於linux的伺服器效能監控工具,主要優勢在於執行速度快、配置簡單,能實時的資源監控工具,它擁有基於 web 的友好介面,ui簡潔,可以通過圖表來了解 cpu,ram,硬碟,網路,apache, postfix 等軟硬體的資源使用情況,像絕大多數常用的圖表資料(cpu,ram,網路和硬碟)都在頂部。如果你想深入了解圖形化資料,你只需要下滑滾動條,或者點選在右邊選單的專案。通過每個圖表的右下方的按鈕, netdata 還能讓你控制圖表的顯示,重置,縮放。工具安裝說明:切換到root許可權:yum install zlib-devel gcc make git autoconf autogen guile-devel automake pkgconfig -yyum install libuuid-devel zlib-devel -ywget -xzf netdata-v1.11.1.tar.gzcd netdata-1.11.1_rolling/./netdata-installer.sh 有提示 按回車
to stop netdata run:systemctl stop netdatato start netdata run:systemctl start netdata
資源監控篇:如下圖是對系統全景式各類資源使用時效性儀表圖
對於cpu使用情況如下,可以看整個伺服器cpu平均使用情況,
如果想細化看看各個cpu具體是什麼問題引起的,例如是使用者還是system導致cpu高的,具體有幾個執行緒的cpu在忙碌可以如下方式監控:
類似nmon方式也很直觀
磁碟io監控:眾所周知,磁碟io使用是影響資料庫效能最大因素,因為磁碟種類繁多,設計的差異性對io影響巨大,最終對效能影響非常大,例如ssd 和普通7200轉的機械硬碟在讀寫吞吐方面存在多倍的差異性。
網路監控:
而網路中的協議選擇也是問題,監控更是難點,目前 市面上存在ipv4 和ipv6 兩種網際網路協議使用 ,我們在監控過程中有時要進行網絡卡吞吐量情況監控,有些也要對兩種協議使用會進行對比下壓測選型,ipv6的位址分配一開始就遵循聚類(aggregation)的原則,這使得路由器能在路由表中用一條記錄(entry)表示一**網,大大減小了路由器中路由表的長度,提高了路由器**資料報的速而ipv4是用於分組交換網路的無連線協議。它以盡力交付模式執行,因為它不保證交付,也不保證正確排序或避免重複交付。這些方面(包括資料完整性)由上層傳輸協議(例如傳輸控制協議(tcp))解決。不同協議有不同的用途,但是我們在做效能測試過程如果進行監控對比有時或束手無策,而netdata 在這方面做得不錯,提供兩種型別的監控。
儲存檔案使用情況監控:而我們一般會關注磁碟總體使用情況監控,而我們有時會使用多磁碟方式來存放不同型別的資料,例如資料庫的資料儲存防砸sda、日誌儲存在sdb、邏輯備份等存放在sdc等情況,
如下我們postgres的資料儲存在home目錄下
更多功能,期待你去挖掘!!!
全鏈路壓測
2013年為了雙11提前預演而誕生,該服務已提供在阿里雲pts鉑金版。1.1.1 系統可用性問題 經常由下面一些不確定性因素引起 1.1.2 傳統線上單機與單系統壓測的四種方式 從流量分配的角度,將流量集中到某台機器 這兩種方式要求訪問流量不能太小 1.1.3 單系統壓測的問題單鏈路指乙個業務線。全...
全鏈路壓測
之前有和認識的同行聊過他們全鏈路壓測的一些技術實現方案,自己也看了很多相關的資料,這篇部落格,說說自己對全鏈路壓測的理解,以及整理的一些知識點。阿里全鏈路壓測 有讚全鏈路壓測 京東全鏈路壓測 餓了麼全鏈路壓測 一 什麼是全鏈路壓測 基於實際的生產業務場景 系統環境,模擬海量的使用者請求和資料對整個業...
全鏈路壓測筆記
公司業務發展,難有乙個量化的資料衡量核心鏈路的真實峰值。有助於提公升核心業務的穩定性。找出整個鏈路的瓶頸,優化少量的瓶頸部分提公升整體效能,以期達到用最少的資源達到最佳效果。認識誤區 不能單純認為壓測各個子系統後,整體系統沒有問題,因為涉及到業務訪問鏈路,多個業務可能有共用資源的瓶頸,主鏈路請求量增...