有多少種技術能夠在六十五年後依舊能夠熠熠生輝,在it的基礎架構中扮演著重要角色?clos架構應該算是一項。clos架構,誕生於2023年,是由由貝爾實驗室一位叫charles clos的人提出的。clos交換架構可以做到嚴格的無阻塞(non-blocking)、可重構(re-arrangeable)、可擴充套件(scalable),相比傳統的crossbar架構在突發流量處理、擁塞避免、遞迴擴充套件上均有巨大的提公升。
以京東資料中心為例,下圖就是乙個典型的基於clos架構的資料中心解決方案,在這樣的大規模網路中,如何讓資料在傳輸過程中能以最快的速度從傳送端到接收端,成為網路效能調優的關鍵因素。
從上面那張拓撲圖中可以看到,同一資料中心需要經過5個hop(從rack tor 到row spine,到data center spine, 再到row spine,到rack tor),這需要消耗15微秒的延遲。1微秒比15微秒,在執行應用的過程中超過90%的時間消耗到了網路上,這種情形還不包括網路上有任何丟包導致的重傳。
應該說網路影響應用效能的乙個原因是,處理器的效能越來越高,應用到應用之間,點對點延遲越來越低。比如在高效能計算和ai應用中用到的mpi 協議,點對點傳輸的延遲可以小於1微秒(1us), 而現在多數交換機的單個hop延遲超過了3微秒。
那麼,如何減小網路對於應用效能的影響呢?
京東it資源服務部負責人呂科說:"如何降低網路對於應用效能的影響是乙個非常複雜的問題,也是所有的資料中心管理者一直在力求解決的問題。最好的方式就是我們的網路人員和應用人員一起來討論應用對於網路的需求,我們專業的技術團隊會針對需求,測試和選擇最合適的網路產品和網路方案。"京東it資源服務部硬體系統部門技術負責人王中平給出了以下五種解決方案:
1、採用高效能的交換機
如果交換機的效能能從3微秒降低到0.3微秒,這樣的話,整個網路的延時會降低到原來的十分之一。
2、採用效能高而且穩定的交換機
有的交換機**效能不穩定,在不同的包大小情況下,會有不同的**效能,在小包的情況下可以有低的延遲,在大包的情況下延遲會大幅增加,導致網路效能不可**。有的交換機**效能可以不隨著包大小的變化而波動,一直維持在低延遲的狀態。
3、避免出現多對一通訊時的不公平現象
如果出現這種不公平現象,會導致網路**速度不均,出現先到後得的現象。
4、建立快速的網路擁塞控制機制
在大型的網路中,擁塞是不可避免的,如何能有效的管理擁塞和降低擁塞帶來的丟包和重傳,是現在網路管理中非常重要的乙個技術難點。
5、降速慢傳資料策略優於丟包重傳資料
在網路中,降速慢傳和丟包重傳是兩種被用來解決擁塞的方式,實踐證明,慢傳比丟包重傳更能有效的解決擁塞問題。
顯然這種六十多年前的clos集群架構在今天再次煥發出生機。相較於crossbar的部署規模有限,缺乏冗餘的劣勢,clos架構不但適合大規模部署,每個session有冗餘鏈路,而且任何輸入都能找到沒有在同時使用的線路,實現無阻塞架構。
啥 啥 啥,服務治理是個啥
首先,先說下服務治理的邊界,本質上任何能提公升服務可用性,效能,讓服務更穩定等等,只要是能讓服務執行的更好,都屬於服務治理的範疇。服務治理比較常見的話題 服務發現,服務變更管理,服務監控,服務擴容縮容,服務自我保護,服務降級,服務授權防攻擊,服務上線驗證和灰度發布,服務問題定位和跟蹤,服務負載,服務...
CLOS網路架構與FATTREE胖樹拓撲
fattree拓撲結構是由mit的fares等人在改進傳統樹形結構效能的基礎上提出的,屬於switch only型拓撲。整個拓撲網路分為三個層次 自上而下分別為邊緣層 edge 匯聚層 aggregate 和核心層 core 其中匯聚層交換機與邊緣層交換機構成乙個pod,交換裝置均採用商用交換裝置。...
為混合雲精選的架構是啥樣?
現在,雲計算資源的交付和使用已經成為全球的 新常態 因為有了雲平台的支撐,企業可以簡化it服務,建立更多的新業務。在傳統大中型企業開始上雲的大背景下,混合雲成為未來的主旋律,混合架構讓雲廠商通過差異化構建競爭力,促成了目前越來越多新型態雲服務模式的湧現,即 everything as a servi...