演講稿丨芮勇 人工智慧AI之趨勢

2021-09-23 16:25:27 字數 3440 閱讀 3079

尊敬的諸位領導、諸位嘉賓和諸位朋友,非常高興今天有這個機會參加全球人工智慧大會,今天很高興想跟大家交流乙個話題,就是人工智慧ai今後發展的幾個趨勢。

剛才李院士介紹了,今年是乙個很特殊的年份,2023年是「人工智慧」這個詞被正式創造出來的第60年。我們中國人一般稱每60年是乙個甲子,乙個輪迴。但這次不僅僅是乙個輪迴,而是乙個昇華,有很多事情都會發生。60年以前人工智慧這個詞被創造出來了,那60年過去了我們人工智慧有哪些屬性,有哪些大的發展趨勢?我們看一下。也很有意思,有另外幾個也是用a和i開頭的詞。第乙個叫做聚合的智慧型,我想給大家舉個例子,用微軟雲的智慧型api。第二個詞也是ai開頭的,叫做自適應的智慧型,我也給大家舉兩個例子。第三個是更先進的智慧型,叫做**的智慧型,隱於環境的智慧型,人不用考慮它,它就能幫你把事做了。

下面先聊第乙個聚合的智慧型。我給大家用乙個例子,就是微軟發布微軟認知服務。這個基於雲平台的智慧型api能做什麼呢?我們把一批api放在雲上,希望第三方的開發者能夠很容易的呼叫這些api,使得你寫出來的程式、應用可以像我們人類一樣看到世界、聽到世界、理解世界,所以我寫了幾個字叫做像人類一樣理解世界的智慧型api。它包括五個大的方向,第乙個是視覺,第二個是語音,包括tts。語言處理,自然語言的理解。第四個是知識的挖掘,第五個是搜尋。下面我給大家舉個例子。

人臉說完了,那麼比人臉更難的一點是我看到的所有的,計算機有沒有能力像人一樣去理解它所看到的。在計算機領域,如果在座的已經在這個領域的話,一定知道有乙個很重要的比賽叫imagenet,它包括1000個類別,有120萬個訓練樣本,有10萬個測試。這裡面包括很多的型別,文字、車輛、動物、教堂等等。要讓計算機看一幅它沒有看到過的,能告訴你這是屬於這一千類的哪一類,非常難的乙個問題。在過去的七八年過程當中,深度學習使計算機視覺的分類問題得到了乙個飛躍性的發展。大家可以看到在深度學習沒有進入計算機之前,比如2023年的時候錯誤率是25.8%,因為很難,你讓計算機看乙個,它要告訴你這是一千類中間的哪一類。到了2023年的時候深度學習第一次被應用到imagenet計算機視覺的分類當中去,一下子把錯誤率從20%多降到16.4%,之後2023年和2023年錯誤率慢慢的往下走,到了6%點多。2023年的時候我們人類也想說,我們人類在一千類物體識別中我們能做得多好?斯坦福的乙個博士他自告奮勇,他好好看看這一千類當中都有哪些,我相信在座的各位包括我都很難達到這個水平,因為這一千類裡面光狗就有60多種,還有很多的植物,很多的運動,看起來很相似。所以這位博士把自己關在小屋子裡面好好學習了幾個月,他去參加這個比賽,他的錯誤率是5.1%,這是我們人類裡比較傑出的代表。但是在去年年底的時候我們微軟用深度學習的演算法,把錯誤率降到3.5%。這都是得益於深度學習在過去

四、五年的發展。

深度學習在2023年的時候大家用的更多是有九個隱含層,叫做深層網路。我們看看過去四五年由深往更深發展,有多深。2023年的時候有19層網路出來,在2023年的時候我們做了乙個比人類5.1%的錯誤率還要高的深層學習網路。有152層,這是所有機構從來沒有做到過的這麼深效果的網路,因為大家可能知道想把它做得很深,並不是很容易的事情。因為要是有偏差,很多很多次以後就很不穩定了,超過22層就是一件很難的事情。我們的研究員做了152層,中間的結構也很有意思,就像人類的腦神經連線一樣,不僅僅有一層一層接下來的連線,還有直接往前的連線,這是殘差學習的問題。因為這個殘差學習的演算法使得我們能夠做到152層這麼深,這麼深的話我們就把錯誤率降到3.5%,這是乙個很核心的技術。同時我們也在去年imagenet的幾個主要專案中得到了第一名。

除了的分類,比的分類更加難的一件事情是說物體的檢測。的分類你只需要告訴我這張裡面是一張桌子,那個圖是乙個凳子。物體檢測不僅要告訴我這張裡有一張桌子,你要告訴我桌子在哪兒,所以比這更難的就是物體檢測,所以這個也是基於深度學習的演算法,做出了很好的成績,大家可以看到這是其中的乙個例子。對我們人來說這似乎沒什麼了不起的,都能認識,但是我們知道計算機看到的東西就兩個,除了零就是一,他們在零和一之間能夠理解這裡面有乙個小朋友,有乙個吃晚餐的桌子,有喝葡萄酒的杯子等等,這是一件非常非常難的事情。

第二個我想跟大家聊聊skype translator實時語音翻譯技術的自適應的智慧型。這也是乙個很有意思的技術,最早有一點像科幻電影的感覺,我相信在座的朋友很多看過《星際迷航》,這裡面有乙個**,你拿起這個**跟別的星球的任何人說任何的語言都能相互交流。不管他來自哪個國家或者哪個星球,說任何語言都能實時交流。在2023年的時候,這還是乙個科幻,沒有辦法做到。但是我們希望通過人工智慧的技術發展,把科幻變成現實。在2023年的時候我們語音處理的團隊第一次在微軟內部的技術節上展示了這個技術,當時我們可以做到實時的英語和德語的翻譯。在2023年的時候微軟研究院的創始人rick博士在天津的大會上做了演示。這個技術很難,如果我只會說中文,我們台下這位巴基斯坦的女士只會說英文,我想跟她交流要通過幾個過程,首先要把我的中文音訊訊號變成文字,最好不要錯,然後再實時翻譯成英文的文字,然後再用我說英文的方式發出聲音來,讓她能聽懂。第一要實時,第二不能錯,因為這三個環節每乙個錯一點,後面就會有很大的偏差,就完全錯誤了。所以在2023年的時候我們在天津有乙個公開的演示。去年的時候我們已經把這個實時的語音翻譯技術放進了大家都可以使用的產品skype裡。下面我們來看看rick博士在天津舉行的大會上做的實時演示,他不會說中文,他在做演講的時候用英文,說著說著突然之間他開始說中文了,觀眾很吃驚,我們看看。

其實他並不知道那個翻譯的是對還是錯,因為他完全不懂中文,也不會說中文,但是觀眾聽到的是實時的他的發音方式說出來的中文,這是在2023年的時候。當然能做到這一點也是需要20幾年科研的積累,要把所有的技術都做得很好才可以做到這點。這是我提到的第二個ai,自適應的智慧型。

第三個是**的智慧型,可能是一種更高境界的智慧型。我們今天都談智慧型家居、智慧型環境。如果今後有一天這個會場裡面有很多很智慧型的裝置和硬體,我們可能不用太去考慮我是不是得一直站在那個講台那兒,我一走動大家就拍不到我了,我走到這邊太亮了,是不是**就不對了,人就不用考慮了。我們有很智慧型的硬體裝置自動的就做好的,這是隱於環境的一種智慧型。

最後的兩張幻燈片想跟諸位嘉賓和朋友交流的是,人工智慧今年是第60周年,人工智慧這個領域經過了起起伏伏之後,現在也是第三個春天。不管是國內和國外的一些大學、科研機構、企業,都花很大的精力去開發人工智慧技術。因為人工智慧可能代表了今後整個產業的乙個發展方向。

這是我今天想提的第五個ai,最早大家想到ai就是人工智慧,之後我提的ai就是聚合的智慧型、自適應的智慧型和**的智慧型。前一陣因為有很多人工智慧上的技術有了大的突破,在科研界、產業界,甚至我們的大眾老百姓裡面都有很多的討論,說人工智慧和人到底會怎麼樣,有一些說法是人工智慧太強大了,我們人就不存在了,等等。所以有人類和機器要pk的感覺。其實我是持另外的一種觀點,我覺得人類和人工智慧各有強的地方,也各有弱的地方。如果從記憶力和計算能力上來講,人類是記不過計算機的,也算不過計算機的。因為比如說背乙個π3.1415926,沒有計算機強。但是我們人類有兩個半腦的,乙個半腦是靠左邊這個,主要是邏輯推理、記憶。右邊的半腦很厲害的,這是很多的想象力、很抽象的東西,創造力的東西在這裡。所以我們人模擬機器強很多的地方是我們這種創造力、抽象能力和發明的能力。我覺得今後的人工智慧的下乙個60年,是人類+機器,相互使用人類和機器更強的地方,把兩者更強的地方相結合,使得我們有乙個更加增強的智慧型,謝謝大家。

本文**於"中國人工智慧學會",原文發表時間"

2016-04-25"

演講稿丨徐偉 人類離實現通用人工智慧還缺少什麼

人工智慧這個概念最近幾年非常火,我們看到人工智慧傳統的一些研究方向,像計算機視覺,還有語音識別,這些方面在最近幾年都有了過去幾十年不可想象的巨大進展。尤其是上個月googel的alphago和李世石下的那盤棋以後,更是激起了大家對人工智慧高度的熱情。為什麼人工智慧在最近幾年有快速的發展呢?乙個最重要...

腦洞大開丨假如范蠡有了如意推人工智慧名片

腦洞大開丨假如范蠡有了如意推人工智慧名片.陶朱公 范蠡,中國歷史上最成功的商人。早在 2000 多年前的春秋戰國時期,他的財富就已富甲天下,是歷代商人 企業家們推崇的 商聖 同時范蠡可能也是最早使用 名片 的商界人士。據傳,在我國春秋戰國時代,諸侯之間爭霸戰爭不斷,各國致力於擴大疆土,招賢納士,以孔...

人工智慧資料標註領域五大核心需求痛點丨曼孚科技

隨著人工智慧落地商業化進入快車道,無人駕駛 人臉識別 智慧型安防等領域成為了熱門的應用場景,ai公司關注的重點開始聚焦於產業落地能力上。作為人工智慧行業的基礎,資料是實現這一能力的決定性條件之一。因此,為機器學習演算法訓練提供高質量的標註資料服務成為了決定人工智慧應用高度的重要條件之一。相關資料統計...