高併發(high concurrency)是網際網路分布式系統架構設計中必須考慮的因素之一,它通常是指,通過設計保證系統能夠同時並行處理很多請求。
高併發相關常用的一些指標有響應時間(response time),吞吐量(throughput),每秒查詢率qps(query per second),併發使用者數等。
網際網路分布式架構設計,提高系統併發能力的方式,方**上主要有兩種:垂直擴充套件(scale up)與水平擴充套件(scale out)。
垂直擴充套件:提公升單機處理能力。垂直擴充套件的方式又有兩種:
(1)增強單機硬體效能,例如:增加cpu核數如32核,公升級更好的網絡卡如萬兆,公升級更好的硬碟如ssd,擴充硬碟容量如2t,擴充系統記憶體如128g;
(2)提公升單機架構效能,例如:使用cache來減少io次數,使用非同步來增加單服務吞吐量,使用無鎖資料結構來減少響應時間;
在網際網路業務發展非常迅猛的早期,如果預算不是問題,強烈建議使用「增強單機硬體效能」的方式提公升系統併發能力,因為這個階段,公司的戰略往往是發展業務搶時間,而「增強單機硬體效能」往往是最快的方法。
不管是提公升單機硬體效能,還是提公升單機架構效能,都有乙個致命的不足:單機效能總是有極限的。所以網際網路分布式架構設計高併發終極解決方案還是水平擴充套件。
水平擴充套件:只要增加伺服器數量,就能線性擴充系統效能。水平擴充套件對系統架構設計是有要求的,如何在架構各層進行可水平擴充套件的設計,以及網際網路公司架構各層常見的水平擴充套件實踐,是本文重點討論的內容。
反向**層的水平擴充套件
反向**層的水平擴充套件,是通過「dns輪詢」實現的:dns-server對於乙個網域名稱配置了多個解析ip,每次dns解析請求來訪問dns-server,會輪詢返回這些ip。
當nginx成為瓶頸的時候,只要增加伺服器數量,新增nginx服務的部署,增加乙個外網ip,就能擴充套件反向**層的效能,做到理論上的無限高併發。
站點層的水平擴充套件
站點層的水平擴充套件,是通過「nginx」實現的。通過修改nginx.conf,可以設定多個web後端。
當web後端成為瓶頸的時候,只要增加伺服器數量,新增web服務的部署,在nginx配置中配置上新的web後端,就能擴充套件站點層的效能,做到理論上的無限高併發。
服務層的水平擴充套件
服務層的水平擴充套件,是通過「服務連線池」實現的。
站點層通過rpc-client呼叫下游的服務層rpc-server時,rpc-client中的連線池會建立與下游服務多個連線,當服務成為瓶頸的時候,只要增加伺服器數量,新增服務部署,在rpc-client處建立新的下游服務連線,就能擴充套件服務層效能,做到理論上的無限高併發。如果需要優雅的進行服務層自動擴容,這裡可能需要配置中心裡服務自動發現功能的支援。
資料層的水平擴充套件
在資料量很大的情況下,資料層(快取,資料庫)涉及資料的水平擴充套件,將原本儲存在一台伺服器上的資料(快取,資料庫)水平拆分到不同伺服器上去,以達到擴充系統效能的目的。
網際網路資料層常見的水平拆分方式有這麼幾種,以資料庫為例:
按照範圍水平拆分
每乙個資料服務,儲存一定範圍的資料,上圖為例:
user0庫,儲存uid範圍1-1kw
user1庫,儲存uid範圍1kw-2kw
這個方案的好處是:
(1)規則簡單,service只需判斷一下uid範圍就能路由到對應的儲存服務;
(2)資料均衡性較好;
(3)比較容易擴充套件,可以隨時加乙個uid[2kw,3kw]的資料服務;
不足是:
(1)請求的負載不一定均衡,一般來說,新註冊的使用者會比老使用者更活躍,大range的服務請求壓力會更大;
按照雜湊水平拆分
每乙個資料庫,儲存某個key值hash後的部分資料,上圖為例:
user0庫,儲存偶數uid資料
user1庫,儲存奇數uid資料
這個方案的好處是:
(1)規則簡單,service只需對uid進行hash能路由到對應的儲存服務;
(2)資料均衡性較好;
(3)請求均勻性較好;
不足是:
(1)不容易擴充套件,擴充套件乙個資料服務,hash方法改變時候,可能需要進行資料遷移;
這裡需要注意的是,通過水平拆分來擴充系統效能,與主從同步讀寫分離來擴充資料庫效能的方式有本質的不同。
通過水平拆分擴充套件資料庫效能:
(1)每個伺服器上儲存的資料量是總量的1/n,所以單機的效能也會有提公升;
(2)n個伺服器上的資料沒有交集,那個伺服器上資料的並集是資料的全集;
(3)資料水平拆分到了n個伺服器上,理論上讀效能擴充了n倍,寫效能也擴充了n倍(其實遠不止n倍,因為單機的資料量變為了原來的1/n);
通過主從同步讀寫分離擴充套件資料庫效能:
(1)每個伺服器上儲存的資料量是和總量相同;
(2)n個伺服器上的資料都一樣,都是全集;
(3)理論上讀效能擴充了n倍,寫仍然是單點,寫效能不變;
快取層的水平拆分和資料庫層的水平拆分類似,也是以範圍拆分和雜湊拆分的方式居多,就不再展開。
高併發(high concurrency)是網際網路分布式系統架構設計中必須考慮的因素之一,它通常是指,通過設計保證系統能夠同時並行處理很多請求。
提高系統併發能力的方式,方**上主要有兩種:垂直擴充套件(scale up)與水平擴充套件(scale out)。前者垂直擴充套件可以通過提公升單機硬體效能,或者提公升單機架構效能,來提高併發性,但單機效能總是有極限的,網際網路分布式架構設計高併發終極解決方案還是後者:水平擴充套件。
網際網路分層架構中,各層次水平擴充套件的實踐又有所不同:
(1)反向**層可以通過「dns輪詢」的方式來進行水平擴充套件;
(2)站點層可以通過nginx來進行水平擴充套件;
(3)服務層可以通過服務連線池來進行水平擴充套件;
(4)資料庫可以按照資料範圍,或者資料雜湊的方式來進行水平擴充套件;
各層實施水平擴充套件後,能夠通過增加伺服器數量的方式來提公升系統的效能,做到理論上的效能無限。
究竟啥才是網際網路架構「高併發」
一 什麼是高併發 高併發 high concurrency 是網際網路分布式系統架構設計中必須考慮的因素之一,它通常是指,通過設計保證系統能夠同時並行處理很多請求。高併發相關常用的一些指標有響應時間 response time 吞吐量 throughput 每秒查詢率qps query per se...
究竟啥才是網際網路架構「高併發」
一 什麼是高併發 高併發 high concurrency 是網際網路分布式系統架構設計中必須考慮的因素之一,它通常是指,通過設計保證系統能夠同時並行處理很多請求。高併發相關常用的一些指標有響應時間 response time 吞吐量 throughput 每秒查詢率qps query per se...
究竟啥才是網際網路架構「高併發」
一 什麼是高併發 高併發 high concurrency 是網際網路分布式系統架構設計中必須考慮的因素之一,它通常是指,通過設計保證系統能夠同時並行處理很多請求。高併發相關常用的一些指標有響應時間 response time 吞吐量 throughput 每秒查詢率qps query per se...