什麼是負載均衡
負載均衡(load balance)是分布式系統架構設計中必須考慮的因素之一,它通常是指,將請求/資料【均勻】分攤到多個操作單元上執行,負載均衡的關鍵在於【均勻】。
常見的負載均衡方案
常見網際網路分布式架構如上,分為客戶端層、反向**nginx層、站點層、服務層、資料層。可以看到,每乙個下游都有多個上游呼叫,只需要做到,每乙個上游都均勻訪問每乙個下游,就能實現「將請求/資料【均勻】分攤到多個操作單元上執行」。
【客戶端層->反向**層】的負載均衡
【客戶端層】到【反向**層】的負載均衡,是通過「dns輪詢」實現的:dns-server對於乙個網域名稱配置了多個解析ip,每次dns解析請求來訪問dns-server,會輪詢返回這些ip,保證每個ip的解析概率是相同的。這些ip就是nginx的外網ip,以做到每台nginx的請求分配也是均衡的。
【反向**層->站點層】的負載均衡
【反向**層】到【站點層】的負載均衡,是通過「nginx」實現的。通過修改nginx.conf,可以實現多種負載均衡策略:
1)請求輪詢:和dns輪詢類似,請求依次路由到各個web-server
2)最少連線路由:哪個web-server的連線少,路由到哪個web-server
3)ip雜湊:按照訪問使用者的ip雜湊值來路由web-server,只要使用者的ip分布是均勻的,請求理論上也是均勻的,ip雜湊均衡方法可以做到,同乙個使用者的請求固定落到同一臺web-server上,此策略適合有狀態服務,例如session(58沈劍備註:可以這麼做,但強烈不建議這麼做,站點層無狀態是分布式架構設計的基本原則之一,session最好放到資料層儲存)
4)…常用的有nginx+tomcat、apache+tomcat等
【站點層->服務層】的負載均衡
【站點層】到【服務層】的負載均衡,是通過「服務連線池」實現的。
上游連線池會建立與下游服務多個連線,每次請求會「隨機」選取連線來訪問下游服務。
常用的有rmi、http、webservice、hessian、rpc、jms等
【資料層】的負載均衡
在資料量很大的情況下,由於資料層(db,cache)涉及資料的水平切分,所以資料層的負載均衡更為複雜一些,它分為「資料的均衡」,與「請求的均衡」。
資料的均衡是指:水平切分後的每個服務(db,cache),資料量是差不多的。
請求的均衡是指:水平切分後的每個服務(db,cache),請求量是差不多的。
業內常見的水平切分方式有這麼幾種:
一、按照range水平切分
每乙個資料服務,儲存一定範圍的資料,上圖為例:
user0服務,儲存uid範圍1-1kw
user1服務,儲存uid範圍1kw-2kw
這個方案的好處是:
(1)規則簡單,service只需判斷一下uid範圍就能路由到對應的儲存服務
(2)資料均衡性較好
(3)比較容易擴充套件,可以隨時加乙個uid[2kw,3kw]的資料服務
不足是:
(1)請求的負載不一定均衡,一般來說,新註冊的使用者會比老使用者更活躍,大range的服務請求壓力會更大
二、按照id雜湊水平切分
每乙個資料服務,儲存某個key值hash後的部分資料,上圖為例:
user0服務,儲存偶數uid資料
user1服務,儲存奇數uid資料
這個方案的好處是:
(1)規則簡單,service只需對uid進行hash能路由到對應的儲存服務
(2)資料均衡性較好
(3)請求均勻性較好
不足是:
(1)不容易擴充套件,擴充套件乙個資料服務,hash方法改變時候,可能需要進行資料遷移
總結
負載均衡(load balance)是分布式系統架構設計中必須考慮的因素之一,它通常是指,將請求/資料【均勻】分攤到多個操作單元上執行,負載均衡的關鍵在於【均勻】。
(1)【客戶端層】到【反向**層】的負載均衡,是通過「dns輪詢」實現的
(2)【反向**層】到【站點層】的負載均衡,是通過「nginx」實現的
(3)【站點層】到【服務層】的負載均衡,是通過「服務連線池」實現的
(4)【資料層】的負載均衡,要考慮「資料的均衡」與「請求的均衡」兩個點,常見的方式有「按照範圍水平切分」與「hash水平切分」
**12306核心模型設計思路和架構設計
九又vr技術負責人官山山:九又vr平台架構設計的深層思考
滴滴出行分而治之的架構設計之道
一文讀懂hadoop、hbase、hive、spark分布式系統架構
Nginx負載均衡演算法分析
負載均衡就是將負載分攤到不同的服務單元,即可保證服務的可用性,又保證響應足夠的快,給使用者很好的體驗,nginx的負載均衡可以劃分為兩大類,內建策略和擴充套件策略。內建策略包括加權輪詢和ip hash,在預設的情況下這兩種策略會編譯進nginx核心中,只需要在nginx中配置指明引數即可。1.加權輪...
haproxy和nginx負載均衡分析
出於對負載均衡工具的疑問,分別對haproxy和nginx的負載均衡進行了抓包分析,分析的過程跟大家分享下。先說下對haproxy抓包得到的結論吧 haproxy在負載均衡的一台後端掛掉後,如果還沒達到探測的時間點時,請求還會往掛掉的這台 請求會丟失。haproxy負載均衡的實驗過程如下 1 先看下...
幾種軟負載均衡策略分析
公司去年上了f5,好用是好用,但是費用太高昂了,所以最近一直在研究軟負載均衡這一塊兒,恰巧今年年初谷歌開源了seesaw,讓自己可以繞過很多彎路。特此總結下之前了解的負載均衡策略。sunface 在分布式系統中,負載均衡是非常重要的環節,通過負載均衡將請求派發到網路中的乙個或多個節點上進行處理。通常...