萬變歸宗 關鍵業務看高階 高階儲存看架

2021-09-23 02:26:24 字數 2785 閱讀 6575

前不久上映的周星馳大作《美人魚》中,莫文蔚和鄭少秋合唱的這首老歌《世間始終你好》,喚起了不少粉絲的共鳴。筆者認為,這首歌用來形容高階儲存也頗為貼切:別看這幾年關鍵業務領域afa那麼打眼,但還處於社會主義初級/階段,國產高階儲存人家在悶聲發大財、低調練大招呢好不好。

何以見得?您看全快閃儲存器被熱炒,但2023年全快閃儲存器市場份額只有中國儲存整體市場的3%,即使投入再多資源進來,收效估計能在2023年超過兩位數就算不錯了。相應的傳統高階儲存市場雖然在緩慢收縮, 但仍是很多大型企業關鍵資料平台的首選儲存基礎設施。甚至可以說,高階儲存裡的高可靠架構和亮瞎眼的高階資料服務,是afa打馬狂追的方向。(說的遠一些,沒準高階和afa這倆以後兩個巴掌拍在一起了,變成基於固態介質的高階儲存呢,到時候高階儲存還是關鍵業務領域的"世間始終你好"。)

剛才扯得遠了,現在咱看乾貨。儲存系統是否可靠是關鍵業務得以穩定執行的根本。高階儲存系統憑藉著其在可靠性方面的獨特設計,被廣泛用於金融、電力等各行業的關鍵業務。

as18000是浪潮的一款高階儲存系統,其在架構上與業界其他高階儲存產品有著本質區別,也正是這種架構成就了該系統相對更高的可靠性。本文中,筆者就針對as18000高階儲存系統的整體架構做乙個詳細分析以及對比。

中低端儲存:後端共享架構

中低端儲存系統採用的是雙控共享訪問後端的全部磁碟擴充套件櫃,形成如下圖所示的架構:

雙控儲存架構圖

該架構是傳統儲存系統的關鍵點之一,正式利用後端共享儲存的方式,才使得兩個控制器之間才能夠在任何一方出現故障,或者某個鏈路出現問題之後,系統依然可以從另外一條路對硬碟進行訪問。

多種高階儲存架構:哪山更高

高階儲存相比中低端儲存,可靠性和效能必須更高。為了做到這兩點,業界出現了多種高階儲存系統架構。

sdram共享的高階架構:效能和擴充套件性不能兼顧

最早期的架構是採用多控制器(8個、16個或更多控制器),或者更加準確的說:多對兒控制器,組成乙個集群,所有控制器通過某種高速網路共享訪問一大片集中的ddr sdram,利用這片sdram進行訊息傳遞從而相互協同工作,同時將其用作資料快取。這種架構的典型代表如下。

早期高階儲存架構1:點對點直連集中式資料快取架構

早期高階儲存架構2:交換式集中式資料快取架構

其中,部分廠商在設計上增加了一小堆效能相對高一些的sdram記憶體專門用於存放元資料表、各個節點之間的訊息等等元資料,也就是圖中所示的control memory;而資料快取的角色單獨採用容量更大但是速度也低一些的sdram來擔任。

這種架構看似與傳統雙控架構大相徑庭,看似"高大上",而事實上,該架構單從效率上講,其實是有所降低的。我們仔細觀察該架構就可以發現,其本質就是如下圖右側所示的架構。其將本來使用ddr介面與cpu相連的ram,一部分搬移到外面,採用pcie介面相連,這無疑降低了訪問部分記憶體的效能。

資料快取分拆、前後端io控制分拆的高階架構

也就是說,這種通過將資料快取分拆到外面,以及將前後端io控制分開的高階儲存架構,可以實現任意兩點對等訪問資料快取,但是卻降低了效能。同比而言,左側的傳統雙控架構則更加緊湊,前後端的訊息傳遞直接通過ddr介面訪問記憶體,速度更快,但劣勢是前後端耦合在一起,一旦該節點故障,則會損失一對兒前後端訪問通路。

拆到不能分拆,進了死胡同

這種架構後續的發展想必大家也可以推斷出,其將會繼續拆分各個角色。我們可以想一下,還能再將什麼拆開?對了,那就是把io控制器與cpu松耦合分拆。io控制器之前是通過pcie直連到cpu的,現在,可以在所有前後端io控制器之間增加pcie switch,所有的控制節點也通過switch連線這些io控制器。也就是如下圖所示的架構。

我們再來看看廠商包裝之後的圖樣。

美化後的架構圖

從上述這種所謂"共享記憶體"架構的高階儲存系統架構發展史可以看到, 這類架構的出發點很簡單,那就是將能拆開的角色全部拆開,直到無法再拆為止,並且樂此不彼。

上述這套架構已經是分拆這條路線的終點站了,因為再也沒有什麼可以拆開的了。cpu和本地ddr記憶體不能拆開,因為這裡面放的是本地os執行**,拆開之後時延將會非常高,嚴重降低效能。

分布式架構:損失效能,損失強一致性

所以部分廠商最新一代的高階已經徹底放棄了其原有架構,成為徹底的分布式架構。

採用分布式架構的高階儲存

上述高階架構能夠在一定程度上增加系統的可靠性,但是是以損失效能為代價。

浪潮as18000:顏值三高的新一代高階架構

要想既不損失效能,又有足夠的冗餘性,那還得看另外乙個派系的高階儲存架構,也就是浪潮as18000所採用的全對稱式後端共享式架構。

浪潮as18000架構

該架構的優點顯而易見,其並沒有將資料快取分拆集中存放,本地cpu訪問本地ram依然使用ddr介面享受高速率,同時本地cpu也可以訪問其他節點的ram,此時則通過pcie switch,與前文中所述的架構相同。這樣,效能不會降低。同時,由於所有的後端jbod都可以被任何節點直接訪問,而並非之前架構的同乙個jbod只能最多由兩個節點訪問。這就意味著,後端訪問通路的冗餘度可以大於2,比如,as18000滿配16個控制器,則其冗餘度就是16,哪怕系統中僅剩乙個控制器,整個系統依然是可用的。

冗餘度16的as18000

該架構採用pcie switch的ntb特性,將各個節點的一部分記憶體相互對映到本地,本地控制器將需要同步給遠端的訊息、資料寫入本地的這塊記憶體空間,底層硬體就會自動將這些訊息向目標端傳遞。

綜上所述,浪潮as18000的全對稱式後端共享架構,能夠在保證效能的前提下,極大提公升系統的可靠性及擴充套件性。這也是為何該架構如今仍然生命力頑強,而其他的架構已經隕落的原因。

原文發布時間為:

2023年5月16日

「加密」以不變應萬變

隨著資料移動時代的到來,快節奏的工作和生活越來越多的人喜歡把資料儲存在智慧型裝置上,因此帶來的資料安全隱患也成數倍增加。同時網路黑色產業鏈日益猖獗,讓我們的個人資訊形如裸奔。我國,近年來涉及資料保護與利用的立法活動主要圍繞個人資訊保護並且是基於個人資訊保安而展開的。在我國現行的法律法規中,與個人資訊...

程式優化總結 萬變不離其宗

程式優化總結 萬變不離其宗 空間優化,時間優化.目前我們就在pc上,所以主要目標是時間優化.第一步 演算法結構層面的優化.搞懂演算法,從巨集觀層面優化結構,能在乙個層面做的事情,盡量合併一起做 第二步 c語言層面的優化.從函式,語言層面優化程式 1.減少記憶體訪問 2.合併運算 3.空間換時間 4....

程式優化總結 萬變不離其宗

空間優化,時間優化.目前我們就在pc上,所以主要目標是時間優化.第一步 演算法結構層面的優化.搞懂演算法,從巨集觀層面優化結構,能在乙個層面做的事情,盡量合併一起做 第二步 c語言層面的優化.從函式,語言層面優化程式 1.減少記憶體訪問 2.合併運算 3.空間換時間 4.迴圈合併 展開等處理 5.查...