阿里雲CTO章文嵩 GPU高效能計算是下乙個風口

2021-07-05 05:47:51 字數 1777 閱讀 9238

7月22日首屆阿里雲分享日×雲棲大會北京峰會召開,吸引了海內外2000餘名開發者、創業者及生態夥伴參與。

阿里雲cto章文嵩在分享日指出,隨著dt時代的到臨,高效能資料分析需求開始顯現,雲上將形成包括高效能計算在內的技術生態。

章文嵩透露,阿里巴巴內部早期上線了33個gpu線上應用,進行著1億+張級別的訓練,同時配備了2p flops的gpu計算集群,結果在一周之內就被幾乎全部占用,這是阿里雲此前沒預料到的。而當下在識別領域就出現了諸如face++ deepglint senstime linkface cogtu等眾多初創公司,因此章文嵩判斷,基於深度學習的影象,語音技術應用即將爆發。這些技術的爆發帶來乙個非常迫切的問題:高效能資料分析。

gpu高效能計算背後的新需求

為了更好闡述這一觀點,章文嵩從多方面進行了剖析:

內部:去年阿里集團內部共上線了33個gpu應用,對應的訓練已經到1億+張。在阿里雲上線2p flops的gpu計算集群(未來規模還將翻番)之後,一周之內就被所有業務部門一搶而光。已經涵蓋人臉識別、標籤識別、質量控制、商品分類、風格**、拍照購、ocr、語音識別、圖象搜尋、反黃等多個方面,為業務創造了巨大價值。

外部,基於深度學習、圖形圖象識別、語音技術的大規模爆發,業內迅速湧現出如face++、格靈深瞳、linkface、知圖科技等10+創業公司。

在他看來,神經網路在80年代後期出現過乙個低點。2023年前後,從淺層學習到深度學習的演變,將神經網路提高了幾個數量級,對計算需求更高。尤其是近幾年,2023年谷歌大腦用16000個cpu實現深度學習,為整個業界帶來很好的啟示。在網際網路這富饒的土壤上,語音和影象的技術與應用的成熟,深度學習技術與業務的緊密結合,使得技術的投入和發展進入了良性迴圈。「我們可以看到,資料和計算成為爆發的基石。比如深度學習模型對資料依賴性非常高。過去解決問題是從模型演算法著手,現在更多是獲得高質量資料。資料已然決定了整個模型的訓練效果,高質量的資料當然需要多多益善。這就帶來了乙個巨大挑戰:獲取、儲存海量資料,並要大幅降低儲存成本。要知道,即使是銀行,14天後資料就會清除。另一方面,商業領域計算能力從未過剩。一張的特徵提取要170g次浮點計算;120萬張進行一次網路訓練,需要318p次浮點運算;乙個cpu要算上22天的計算量拿gpu來做,大概是18個小時。」

具體來看:

-資料能力。包括資料獲取、資料儲存、資料傳輸、資料加工和資料使用,正如**、汽油和石油只是提煉品一樣,挖掘和提煉能力越高,產出就越高。dt發展的必然階段,就是從資料分析到高效能資料分析。要實現這一點,需要更高效能、更強大的計算能力。

-計算能力。比如谷歌大腦用了1000臺伺服器,每台6核,耗電是600kw,500萬美金的成本投入。而史丹福大學人工智慧實驗室重新做了一遍,只需要3臺gpu伺服器,耗電只有4kw,3.3萬美元的投入。技術演進將帶來巨大變革。在引數模型中,包含gpu,眾核處理器充當記憶體,關鍵計算用hybrid cpu—fpga,在加上極致的軟體效能優化,效能提公升迅猛。「我們在一種模型上的優化,最多可以提公升60%,而美國一家技術創業公司同樣的優化,只能提公升20%。」通過軟硬一體的優化,使得物理機+加速器的能力能直接對外部輸出,將是雲上iaas的第二種形態。這樣的方式下,雲上超算能力不會成為瓶頸。

-構建技術生態。企業不僅需要計算,還有更多配套服務。比如資料、資訊的高速獲取和分發需要極速cdn,資料和資訊儲存需要物件儲存,網際網路應用落地需要雲伺服器、負載均衡、雲資料庫,大資料分析和高效能資料分析需要大資料處理如odps和高效能計算,gpu集群對外輸出(今年9月份天池大資料計算,會讓參賽選手使用gpu集群)。

章文嵩總結道:「我們相信資料能力+計算能力+技術生態,可以實現用技術拓展商業邊界的目標。阿里巴巴聯合更多合作夥伴,開放出更多如同人臉識別、深度學習等人工智慧新技術,和社會分享,幫助企業實現彎道超車。」

阿里巴巴 章文嵩評價左耳朵耗子

下面這個是耗子的主管,lvs專案作者章文嵩博士在內網發的對耗子工作業績的評價 一碼事歸一碼事,關於工作證的討論,我這裡不做任何評價。我只想說一下,我們為什麼請鑽風離開。過去一年多,鑽風在三個大專案aep vpc和docker上都沒有拿到結果,我給他全年3.25 他自評也是3.25 2014年1月,鑽...

阿里雲首席科學家章文嵩(正明)離職,大牛技術一覽

今天是在阿里的最後一天,在阿里的2438天裡收穫很多很多,很榮幸有機會跟很多小夥伴們一起工作 學習和成長,感恩阿里!圖 章文嵩在第四屆雲計算大會 雲計算與資料中心 專題論壇上進行分享 章文嵩近幾年的技術履歷和貢獻可概述為 據爆料,正明的下一站將會是滴滴,我們期待他會依然會堅持自己的堅持,對於他這次的...

GPU高效能程式設計CUDA實戰 第5章執行緒協作

add dev a,dev b,dev c 第乙個引數 啟動的執行緒塊數量。第二個引數 每個執行緒塊中建立的執行緒數量。1.使用執行緒實現gpu上的向量求和 add loop blocks.cu 啟動n個執行緒塊,每個執行緒塊對應乙個執行緒 add dev a,dev b,dev c 改為啟動n個執...