ai已來,未來已來
黃偉雲知聲董事長、語音識別技術應用專家
黃偉:大家下午好!非常感謝邀請。我覺得前面山世光對公司有乙個非常好的定位,介於學術和產業之間。我可能是唯一乙個做雲技術,第二我們可能長期在工業界。今天人工智慧熱潮十多年比較冷的乙個方向,這樣我更多從工業界角度來看,我們可能對ai的看法和認知。今天題目是雲知聲的成長之路。
其實ai在過去60年裡面,我們經歷過高潮和低谷,在過去兩次相對比較失敗低谷裡面,確實是當時乙個技術條件,產業條件可能沒有達到那個需求。要麼是運算能力不足,要麼是沒有大資料,當然不可能有新的理論演算法所支撐。今天第三次高潮,這三個要素相對比較具備。今天我們學習方法有相對比較成功的演算法,深度學習。另外這個pc網際網路和移動網際網路,人和人之間,裝置和裝置之間,裝置和人之間產生大量的海量資料。
同時,今天有更的強運算單元,不光有cpu,還有gpu,使得我們可以用一些具備運算資源。我們一方面不能忽視使用者習慣的養成。在中國10多年網際網路發展過程當中,使用者養成非常好的使用者習慣,這個技術成熟使用者之間形成乙個非常好的集合點,某些領域裡面今天這個ai技術使得更加成熟,做成產品化和商業化。在家具、醫療等很多領域,今天ai已經產品化和商業化。
簡單介紹一下機器學習演算法的演進。上一代基於統一學習,我讀書的時候進實驗室開始學,用統計學方式進行描述,使得這個模型對於未來產品資料進行比較準的**。在雲方面2023年的時候,微軟研究員最先把深度學習用在雲識別系統裡面。c2c這些技術使得我們在過去4年前,我們的技術水平得到進一步的提高。4年前語音識別已經進入領域,4年前不光演算法本身還是迭代從當時90%提高到今天97%,今天在日常對話,說100個字不再需要修改什麼內容,這就是演算法和資料提公升的巨大的進步。
今天看到深度學習幾乎我們可以說學習領域裡面顛覆了,包括像語音合成,包括翻譯等等,為什麼取得這些突破?我們之前所謂深度學習,人類、科學家一些知識,事先設定一些結構,使得模型結構對這個資料進行的描述,面對一些真實的產品的時候,依然具有非常好的能力。人最歸有限,面對海量資料的時候,頂級科學家實驗室的知識都是不夠的。深度學習從資料終學習特徵,我們可以看到橫座標是資料規模,縱座標是資料精度。
基於統計學習資料規模到一定程度以後,這個效能不再增加了,相對比較平坦,說明統計模型對大資料模型是有上限的。其實這個資料本身對這個效能影響非常大的,剛參加工作的時候,摩托摩拉在手機做語音識別系統,當時做一國語言所用資料大概100小時左右,但是今天做乙個國家語言是以10萬為單位,資料增長可以完成很多不可能完成的任務。
這個是我們在過去幾年裡面,雲知聲在技術上的演進,2023年雲知聲成立,發布了免費的開放的語音指標,當時是做到了85%,今天我們說你說100個字裡面有15個字錯,基本上覺得這個系統是不可用。4年前85%的指標已經是業內最高水準,超過很多上市公司水準,這個是當時我們用統計模型做到了極限。三個月之後,在2023年年底時候把深度學習同樣用800小時資料做了深度學習系統,從25%提公升到90%,比同行業高了10個點。
乙個演算法層面突破會在系統上帶到質的超越,帶到產業落地。當然後面隨著一方面演算法不斷優化,一方面資料不斷迭代,2023年7月份之前我們準確率已經達到97%,中間還有一些其他的特點出來,包括2023年的時候推出了雙麥克乙個降噪,這些過去在四年裡面應用和技術方面做的不斷突破。
這裡講雙麥克(音譯),因為我代表工學界。我們知道10月份的時候,谷歌發布雙麥克,我們看到亞馬遜推出的7+1麥克風。他們做到降噪等等,很重要乙個點,雙麥克風只有乙個麥克風,間距不到5公分,這樣很便捷應用在各種產品下面。不管這個產品是電視劇集還是冰箱等等都可以用。雙麥克風再乙個低成本下面滿足了大部分使用場景,我們有可能以雙麥克風為載體,使我們技術盡快走到千家萬戶,使使用者能夠使到ai技術,一方面養成使用者使用習慣,第二使得更多資料,使得系統更多進一步的優化空間。
另外,我們對於雲理解什麼?雲不光是聲音和文字,還是文字之後我們對它的意思理解,這個夠了嗎?語言是乙個非常博大精深,字面意思不能表示正式意圖。還有另外乙個進展,提供了雲計算,我們有時候從語音到文字,或者從文字不一定看到最準確的意圖。舉個例子,我對著機械人,我說今天天氣真冷,這個字面意思大家知道溫度比較低。比如汽車裡面能不能把空調調高一度,但是戶外說可能需要加外套,這個實際上把字面意思和物理環境,甚至和人的知識匯集在一起,應該是一種綜合計算。讓機器變的更加智慧型,對使用者需求有一種更加精確的把握。
這個今天在很多產品裡面已經用到了。第二個前面山世光老師說到了,運算能力。我們今天有兩種做法,我們以人的大腦做對比,我們今天ai系統一方面缺少很多資料,在語音也好也好,跟我們人的大腦無論遺傳還是後天是完全不能成比例。我們運算能力,人的大腦是非常複雜乙個運算單元,可以用數以億計的神經元,乙個龐大的處理器,每個神經元不一定能夠計算。計算伺服器搭建成乙個計算集群,每個運算單元並不是很強,但是規模很大,把很多運算單元有機結合一起,使得它能完成非常複雜的任務。
這個圖,傳統做法我們先構建乙個專用訓練集群,然後訓練出非常好系統之後,把這個系統部署到外網為使用者提供智慧型服務雲。這個系統執行一段時間以後,肯定會儲存很多資料,把這個資料弄回來做內網和資料開發,是這樣乙個過程。這個資料不是時時的,也不能及時對很多進行計算。上層是把智慧型服務和智慧型學習結合在一起,這樣使得集群白天可以服務,晚上可以工作,類似於alphago和李世石下棋的時候,白天下完棋了,李世石非常累回去睡覺了,但是alphago還再不斷迭代這樣就使我們後台和使用者之間實施使用者互動。
通過我們產品服務體系,搭建了乙個基於雲端新的服務體系,所以需要我們很多場景裡面選擇一些垂直行業切入,做好這個服務,智慧型化不斷提高。當然這種服務通過雲,通過終端,通過晶元方式選擇一些行業切入。到今天為止,我們每天平台量已經接近兩個億,這個資料不是特別新,有超過乙個億的終端機服務。12年相比服務增長量在18%以上,前兩天看了乙個資料,其中一塊業務從過去的每天的大概幾十萬次呼叫,增長到今天一億次呼叫。一方面我們確實今天使用者對使用語音習慣變的越來越強烈,第二個方面技術水平越來越高,使得使用者願意用,經常用。在使用者和服務之間資料是流動,使得服務變的越來越好,使得資料能夠幫助我們開發出更好的水平,只有這樣我們所謂人工智慧服務真正進入我們的家庭。
這個是我們大概發展歷程,雲知聲四年公司了,因為我們一直用比較新的思路做乙個企業。可能說在中國公司比較深的感觸,我們不光在工業界、學術界,跟國外還有乙個差距,中國和國外環境不太一樣。首先,在座很多朋友我們一般雖然我們受過高等教育,我們不願意為技術買單,當然這個環境在改變。第二個,技術離商業化比較遠,可能商業公司只願意做後面事情,但是我們一些學術團體只能做前面,中間學術沒有往前走,但是商業這一塊不願意往後來,這是中國的現實。
我們用比較新的做法,比如我們在12年6月份成立,三個月之後發布國內第乙個免費語音平台,當時環境下面語音算是乙個門檻非常高的技術,當然也有比較不錯的議價能力。我們認為人工智慧其實它的生存與發展不依賴於收多少費用,而是多少使用者,和多少資料。正是因為我們認識到這個資料對技術驅動重要意義,我們三個月以後發布國內第乙個免費開放平台,付出代價是成本。我們團隊管這個平台,我們獲得了使用者的口碑,使用者資料,這些能夠幫助我們引擎不斷提公升和迭代。
這是我們再乙個模式上的創新,在技術方面我們算國內比較早的把深度學習應用到工業界裡面。在12年12月底把深度引擎服務給廠商。最最值得我們創業公司去分享一點,在四年裡面通過我們努力,探索怎麼把技術變成產品,而且這個產品能夠給使用者創造價值,而且還能在夾縫中求生存。我們看到人工智慧領域不光說國內巨頭,都在做。我們做創業公司,無論語音還是圖象還是文字,這裡面**是你的優勢,讓你飛的更高。我們認為選擇比較適合我們的路,今天選擇一些方面,我們恰恰形成我們先發優勢。
這個今天完全不是概念,這個已經產品化一些東西。比如說左邊像乙個球一樣,美的發布第一款壁掛式空調,可以全程遠距離互動。格力空調是親自給苗部長親自演示,獲得今年產業最高獎。右邊是孩兒空調,去年開賣的樂視電視。這裡面現象比較容易,但是還是比較難的,大家體驗過的在手機端上的雲識別之外,很多問題距離比較遠的時候,聲波在衰竭怎麼辦?我距離比較遠不可能讓人按紐,能不能通過聲音喚醒他。還要考慮是不是符合低成本標準,低功耗標準。
我們大家知道,我們能夠看到用這種技術做互動的公司和廠商少之又少。我們大家看到只有亞馬遜那個alphago,我們一方面看到未來,我們一方面看到這個技術難度非常大。這個車裡面,後視鏡、導航儀等等,在車裡面做到全程語音互動,手不用參與,眼睛不用參與。這個也是大概做的非常不錯,這個是我們去年和中國的最好醫院,北京****合作,把雲技術做進了大家都認為很封閉的醫療系統,而且這個今年在****推廣。今天醫生不再需要用手用病例,這個可以提高效率。好醫生在中國是非常稀缺的資源,醫生每天平均節約3.8個小時,增加商業價值。
本文**於"中國人工智慧學會",原文發表時間"
2016-10-26 "
AI 未來已來 把握現在
近幾年來,人工智慧 ai 一直都是各大 的熱點話題,機器學習 深度學習和人工智慧都頻繁的出現在各種文章中。就算是在平時和朋友的聊天中,也經常會聊到ai的話題。然而,除了ai的熱度,究竟什麼是人工智慧 機器學習 深度學習?這三者之間又有什麼關係呢?卻鮮有人能分的清楚,下面就先來個科普,說下這個話題。人...
未來已來,騰訊AI計算網路
毫無疑問,人工智慧是近年it界最火的研究方向,特別在2016年alpha go這一標誌性事件後,國內外科技巨頭持續加大對人工智慧的投入。目前,人工智慧的主要方向如影象識別 語音識別等等都是通過機器學習的方式,借助強大的計算平台對海量資料進行分析 計算,隨著資料量的增長,單機效能已逐漸無法滿足計算的需...
2018 未來已來
2017年11月15日,infor大中華區使用者暨合作夥伴峰會在上海外灘w酒店成功舉辦。本次峰會以 聚勢謀遠,協力必達 為主題,近三百位來自中國大陸,香港和台灣各行各業的重要客戶代表 業界精英 行業專家 記者及合作夥伴應邀出席。infor向與會者分享了infor全球戰略 雲業務及infor birs...