11月21日,在資訊產業部科技司的指導下,由中國電子工業標準化技術協會(簡稱中電標協)、中國電子技術標準研究所主辦,由中電標協高效能計算機標準工作委員會(簡稱高標委)和上海瀾起科技****協辦的中國高效能計算機節能技術標準與應用研討會在北京舉行。來自資訊產業部科技司、中電標協、高標委等**機構以及英特爾、瀾起科技、曙光等公司的代表出席了會議。資訊產業部科技司司長韓俊在研討會上表示,「建設環境友好型、資源節約型社會,資訊產業部應當有所作為,也能夠大有作為。」
據統計,2023年我國規模以上電子資訊產品製造業綜合能源消耗量為1357萬噸標準煤,萬元增加值能耗為國民經濟平均水平的1/7,為工業平均水平的1/15。但是,對於一些大型資料中心、大型運算中心而言,由於伺服器、高效能計算機都是集中、批量地部署,其節能減排工作已經刻不容緩。
高效能計算機已成「電老虎」
近年來,隨著計算機硬體成本大幅降低,加上linux集群優勢突出,使用者部署的高效能計算機系統規模越來越大,節能降耗也因此成為廠商和使用者不容忽視的一大課題。2023年落戶上海超算中心的10萬億次曙光4000a目前仍是國產最快的超級計算機。高標委主任、曙光總裁歷軍在會上介紹說,「這台機器每年光電費就要400多萬元,平均每天就是一萬多。2023年我們還會推出每秒執行100萬億次的機器,如果還按照現在的情況,光是能源的消耗就會遠遠大於超級計算機自身的價值。因此,在下一代高效能計算機的設計和研發過程中,必須解決好節能降耗的問題。」
跟上海超算中心比起來,中石油東方地球物理公司(bgp)資料中心的電耗成本更是高的驚人。該公司總工程師賴能和談到,從2023年到2023年,bgp所擁有的cpu數量、總體運算能力、總儲存容量分別增長了40倍、7354倍和300倍,現在擁有1萬多顆cpu規模的資料中心的電費總支出每天要4.8萬元,因此每年光電費成本就高達1700多萬元。
對於伺服器使用量較少的中小企業來說,能耗問題也同樣不容忽視。有統計資料表明,現在一台伺服器3年內所消耗掉的電力成本可能會超過伺服器當初的採購成本。史丹福大學的一項研究顯示,2023年美國用於伺服器產品上的電費高達27億美元,佔了美國總電費的1.2%,而且值得注意的是,其中伺服器本身執行時需要消耗的電力,和製冷、散熱等輔助系統所需要的電力二者之間接近1:1的關係。「中國目前有近1億台膝上型電腦或台式電腦,但我們的伺服器保有量大約是200萬台,這個比例還遠遠沒有達到發達國家的水平,比如美國每10臺pc會匹配一台伺服器,因此,我們還有很大的發展空間,預計能達到1000萬台伺服器,計算下來,每年就會消耗掉300億度甚至更多的電能,排放幾千噸的溫室氣體。」高標委秘書長曾宇為與會代表算了這樣一筆帳。可見,計算機的耗電不僅會影響到使用者的利益,也關係到整個社會的可持續發展。
高效能不要高耗能
針對如何有效解決超大處理中心的高密度機架的綠色供電、散熱、高功耗問題,利用風道設計、智慧型冷卻、能量智控等技術,建設綠色資料處理中心,已經成為全球主要hpc製造商的關注焦點之一。
曾宇介紹說,從最新的全球高效能計算機top500排行榜可以看出,目前高效能計算機呈現出以下趨勢,即刀片伺服器步入泛應用期,伺服器節能技術趨於成熟,以虛擬化技術為基礎的效用伺服器浮出水面,可重構計算顯露身手,個人hpc成為新寵兒。而節能已經成為這些技術中不可缺少的重要因素。為了提高hpc的每瓦特效能,我們需要從晶元級、系統級和基礎架構級等多個層面來研究開發節能技術,節能已經成為未來千萬億次計算機研發中必須逾越的一大障礙。
在晶元層面,英特爾的eist、amd的powernow!、ibm的高熱傳導介面晶元冷卻技術以及上海瀾起科技的amb晶元等都提供了非常出色的節能技術。如amd barcelona可以動態地進行電源管理,對核心和記憶體控制器提供分離的電源**,對每個核心單獨調整到mhz,自動關閉不使用的邏輯電路區域等。英特爾更是在工藝和電晶體材料上做出了重大改進,如今年11月推出的penryn處理器採用了45奈米工藝,用高-k材料代替傳統的矽,使得摩爾定律得以再延續10-15年。
值得一提的是,隨著多核cpu的發展,伺服器中的記憶體容量越來越大,記憶體子系統也因而成為能耗大戶,特別是對於採用fbd全緩衝記憶體的架構而言。由於每個fbd記憶體條的功耗為9瓦特左右,如果配上32條記憶體,其總功耗就接近300瓦特,遠遠大於cpu和晶元組的能耗。功耗增加不僅導致記憶體溫度公升高,散熱成本增加,而且會影響到可靠性,並縮短器件壽命——在室溫(21度)的基礎上,每增加10度,可靠性就會降低50%。對於fbd記憶體而言,其核心晶元amb是整個系統中功耗最大的器件群。上海瀾起科技董事長楊崇和介紹說,瀾起科技已成功研製出了新型的amb晶元,和目前市場上的amb相比,新型amb可節能30-50%。
在伺服器系統軟硬體層面,許多伺服器廠商在研究如何進一步提高電源使用效率,基於負載情況動態調整節點狀態,根據不同使用者程序能耗的不同進行cpu任務佇列的排程,將一些產生較多熱量的任務從溫度較高的cpu上遷移到溫度較低的cpu上。如曙光自適應功率管理軟體可以根據效率曲線來動態關閉和開啟電源,與監控系統和排程系統相結合,可以探測空閒資源,通過降低cpu頻率、關閉cpu核心等手段來降低空閒資源的能耗,據中石油bgp測試可降低25%的能耗,該技術將會被應用到下一代超級計算機曙光5000中。
英特爾公司技術專家joseph tsang則談到,由於ups、psu、伺服器風扇、vr等部件在實現交直流電的轉換過程中,往往會損失掉一部分效能。在傳統的系統設計中,能源效率只有48%,即每輸入1瓦特電能中損失了52%;而如果通過優化設計,比如去掉一些轉換器之後,能源效率可以提公升到76%,而且更少的部件也意味著更高的可靠性。
除了晶元層和系統層,在資料中心的基礎架構方面同樣有很多可創新之處。比如,在一些老的資料中心裡,熱風與冷風往往混雜在一起,氣流不夠科學,從而影響散熱,而如果將熱風區和冷風區隔離開來,就能大大提公升散熱效果。虛擬化也能起到節能的效果,通過整合,將原來分別執行在多台伺服器上的應用整合到一台伺服器上,不僅能減少伺服器數量,降低能耗,還可以通過動態負載均衡來實現虛擬機器的遷移,提高系統高可用性。此外的節能技術還有液體冷卻、金屬冷卻、智慧型溫控風扇等等。
其實,在過去幾年裡,技術進步已經為高效能計算機帶來了更好的每瓦特效能和每平方英呎效能。joseph tsang舉例說,2023年為了實現3.7 tflops的效能,需要25個機櫃、512臺伺服器,占地1000平方英呎,用電128kw;而到2023年,同樣是實現3.7tflops的效能,僅需要乙個機櫃、53個刀片,占地僅40平方英呎,能耗只需21kw。但面對未來的百萬億次和千萬億次計算時代,我們要做的工作還很多。
除了技術創新,還應該制定出有效的低功耗標準。美國電子器件工程聯合委員會儲存器委員會(jedec)主席羅丹德認為,計算機已普及並影響到更多的產品,而資料中心又是計算機使用中增長最快且使用者群最大的工具之一,制定低功耗標準已是迫在眉睫。據悉,高標委目前正在制定刀片伺服器的一系列標準規範,而且計畫明年會針對石油、氣象等行業推出高效能計算行業應用標準。
政企聯手打造節能生態環境
隨著中國pc、伺服器等計算裝置市場保有量的不斷增加,計算機的能耗問題也引起了**機構、企業和專家學者的廣泛關注。近幾年來,信產部在節能降耗方面開展了大量工作,如研究建立了電子資訊產業節能監控體系,組織修訂了《電子工業爐窯能耗等級標準》,組織開展節能產品的推廣應用,推動廢舊電子產品的綜合利用,加強電子節能技術的宣傳引導等。下一步信產部還會推出《關於加強電子資訊產業節能減排工作的指導意見》及其他鼓勵企業加強節能減排工作的切實舉措。
隨著高效能計算機規模越來越大,能耗問題也會越來越突出,節能問題已經刻不容緩。只有從**、企業各方面加大制定節能制度、完善節能措施,才能保證高效能計算機領域的科學發展,構建高效能的綠色生態環境。
vijos1534 高效能計算機
背景wintercamp 2001 高效能計算機 hpc description official data official program unknown 描述現在有一項時間緊迫的工程計算任務要交給你 國家高效能並行計算機的主管工程師 來完成。為了盡可能充分發揮並行計算機的優勢,我們的計算任務應...
高效能計算機被指耗電嚴重 我國擬出節能標準
一台計算機一年400萬電費 該次會議由信產部直屬的中國電子工業標準化技術協會及中國高效能計算機標準工作委員會主辦,信產部主管 科技司副司長韓俊親自到場,可見對高效能計算機能耗問題的重視。與會演講的瀾起科技董事長兼ceo楊崇和博士表示,以乙個10萬億次的超級計算機為例,一年要消耗400萬人民幣的電費,...
首款完全基於龍芯高效能計算機9月推出
4月17日電 記者從曙光公司獲悉,曙光將會在今年9月份推出完全基於龍芯cpu的刀片伺服器,該刀片伺服器屆時將裝配到曙光5000系列高效能計算機上。據曙光公司介紹,龍芯刀片伺服器擁有低功耗 安全自主可控的特點並擁有完全自主智財權,可以應用在國防 科研 基因研究 航天等領域。據了解,國產高效能計算機目前...