百度技術開放日筆記 正在形成的「一二四四」體系

2021-12-29 19:58:59 字數 2698 閱讀 5194

百度技術開放日筆記:正在形成的「一二四四」體系,4月21日上午訊息,百度近日舉行技術開放日,百度idl院長林元慶、百度基礎技術體系負責人劉煬就百度當前技術發展思路做了分享。

歸結起來,不難發現百度整個技術體系目前正在形成以下特點:乙個中心,兩大方向,四大ai要素,四大雲計算應用平台。

乙個中心,即以「百度大腦」為中心。

百度idl院長林元慶表示,百度目前全力押注的人工智慧航向,最主要的就是希望打造出「百度大腦」,讓機器在多個領域擁有與人腦類似的能力,比如語音、影象、自然語言處理、語義分析等,並且在此基礎上擁有大資料之後的使用者畫像能力。

兩大方向:技術開放平台,abc體系。

首先是開放平台思路,即以開放的思路打造整個技術體系,開放百度技術以讓更多外界研發和應用加入其中。目前,百度已經在深度學習、自動駕駛、nlp等領域推出了開放平台。

其次是「abc體系」,該體系主要是對百度基礎技術體系的概括,「abc」的總結則來自百度總裁張亞勤。在abc體系中,a是ai(人工智慧),b是big data(大資料),c是cloud(雲計算)。

其中,b所代表的big data(大資料)是百度一直擁有的基礎技術優勢,而且作為底層基礎能力,將依靠「a」ai(人工智慧)和「c」cloud(雲計算)平台實現應用,並且值得注意的是,百度之所以加快打造開放平台,目的也是讓更多百度搜尋之外的資料可以匯集進來,資料越大,可能帶來的價值也就越大。

百度基礎技術負責人、百度雲聯席總經理劉煬  

四大雲計算平台:天算、天智、天工,天像。

實際上,無論是演算法還是大資料,背後都離不開「計算力」方面的保障。對此,百度基礎技術負責人、百度雲聯席總經理劉煬則分享了百度在雲計算為核心基礎的「計算力」方面的思路:概括而言是「一基四天」。

一基指的是「基礎雲」,包括計算、儲存、網路、安全。這也是傳統雲服務的基本要素。

更具方向性意義的是開放「四天」:

第一是「天算」,百度雲智慧型大資料平台。

第二是「天智」,人工智慧平台。

第三是「天工」,智慧型物聯網平台。

第四是「天像」,智慧型多**平台。

目前,這四大基礎平台都已通過開放的方式,賦能更多中小企業,並試圖讓更多百度之外的研發者參與進來。

四大ai要素:深度學習、大資料、大計算,大應用。

此外,圍繞百度整個技術體系的「旗艦核心」,百度idl院長林元慶歸結了四大ai發展要素,也是百度當前最核心的研發集中方向。

這四大要素分別是:深度學習、大資料、大計算和大應用。

具體為何是這四大方向,林元慶認為背後的邏輯可以歸結為:有了更好的演算法,就有更好的技術,有更好的技術,就能有更好的產品,就會使更多的使用者來用,因此這是乙個正迴圈。

此外,這四大要素還會以具體平台實現落地:

第一是深度學習的平台。把百度的深度學習平台paddlepaddle開源,做成乙個非常好的開源系統。

第二是開放百度為代表的大規模的計算資源。不管是cpu還是貴得讓你買不起買不到的gpu,百度自己買,開放給你用。「這個計算資源跟paddlepaddle我們會向社會開放和科研單位開放,他們只需要乙個賬號,就可以在這個平台上去做各種各樣的實驗和人工智慧的研發。」

第三是大資料。百度會和目前的共建單位,以及未來可能的合作單位一起定義問題——通過資料或benchmark來定義人工智慧。

「我們會去看哪一些人工智慧的方向是人工智慧領域一些非常核心的,同時也需要技術突破的。這些方向,百度跟合作單位會投入很大的力量,吸引非常多的科研單位到這個平台上我們一起來做研發。我們提供深度學習平台、大計算平台和大資料平台,我們一起研發,希望能夠在一些技術上取得非常大的突破。」

第四是大應用。在上述研發進展取得不錯技術之後,希望能在百度諸多平台上應用起來,讓這些研發出來的技術能夠獲得非常廣泛的應用。

此前,百度牽頭成立的「中國深度學習技術及應用國家工程實驗室」已經正式揭牌,兼任該實驗室主任的林元慶表示,將會以百度為核心,聯合合作夥伴一起推出國家級的七大ai應用平台:深度學習平台、生物特徵識別平台、聽覺感知平台、視覺感知平台、新型人機互動平台、智財權平台和標準化平台。

其中,深度學習平台是最基礎的平台,將由百度來搭建,核心基礎是百度的paddlepaddle深度學習平台。具體方向上,一方面是開放paddlepaddle 深度學習平台,另一方面是開放深度學習的計算模組,不管有gpu,還有大機型的cpu,希望把這個建成中國最大的深度學習平台。

聽覺感知平台。包括語音識別、語音合成、語義理解,還有後端的一些資源。將由百度和清華大學一起做,該技術還讓百度入選了2023年的mit全球十大突破技術榜單。

視覺感知平台,包括檢索識別、清晰影象識別、醫學影像分析等,未來目標是希望拿到一張ct,就能讓機器分析出是不是有癌細胞。這個平台由百度和北航共建。

生物特徵識別平台。這個技術代表性的是人臉識別等,但未來的目標是生物特徵識別、身紋識別、虹膜識別等身份識別。值得一提是,在2023年mit十大突破技術中,該技術裡上榜的所有公司均來自中國,分別是:百度、阿里巴巴和face++。這平台會由百度和清華大學共建。

新型人機交換平台,值得關注的是其中會融合計算機視覺的ar。未來目標是把各種自然的互動系統放在一起,打造乙個基於ai的互動系統,無論是觸控、語音語義識別、自然語言理解,以及計算機視覺等,都融合到一起。這個平台由百度和北航共建。

另外兩個平台是智財權保護和標準化平台。智財權保護由電信研究院來打造,會包括智財權分析、趨勢研究以及研發建議等。標準化平台,則由電子四院來研究,目標是把實驗室研發出來的很多技術都標準化,希望很多研發出來的技術,當它足夠成熟的時候,能夠應用在各個行業。

百度技術開放日見聞

大家知道在大資料應用的環境下,儲存是乙個非常難以解決的問題。傳統儲存的解決方案無法滿足大規模資料 非結構化資料儲存的問題。傳統的資料庫 檔案系統無法滿足需求,一方面無法支援大規模資料儲存,不能很好的做到 scale out 另一方面大資料環境下的 workload 和傳統儲存面臨的環境不太一樣。傳統...

百度技術開放日,有哪些乾貨你需要知道?

文 金融分析師陳凱歌 眾裡尋他千百www.cppcns.com度,那人卻在燈火闌珊處 近日宣布將開放大資料平台介面,或可成為傳統行業借助大資料引擎進一步自我改造的機會之一。傳統行業被網際網路思維所衝擊,究其根源,一般是改變了傳統行業的資訊獲取,資源分享和產品銷售的過程,一定程度上大幅降低了資訊不對稱...

百度的「框」正在移動

構成移動網際網路的技術限制與思維界限到底在何處?我們是否真的可以認為移動網際網路開創了乙個網際網路的變革時代?不少人都認為,移動網際網路是由移動裝置和移動應用構建的乙個新的流動網路,與 傳統 網際網路是從本質上有所不同的兩個領域,對此我不能苟同。但移動網際網路將帶來網際網路行業的一次行業革命也是不爭...