AI不是魔法 人工智慧的能與不能

2021-09-20 12:00:30 字數 4954 閱讀 8497

如果把ai技術分為「前端的互動技術」和「後端的人工智慧技術」。前端的互動技術包括語音識別、影象識別和自然語言處理;後端的人工智慧技術就是人工智慧的核心演算法,包括深度學習演算法、記憶**模型演算法等。

這些前後端的人工智慧技術在應用又可分為四類:語音識別、影象識別、自然語言處理和使用者畫像。那麼在這四類具體應用的實現上ai技術給我們生活帶來哪些便利,同時存在哪些侷限?下面一一來解構:

一、語音識別

語音識別

語音識別有兩個技術方向,乙個是語音的識別,另乙個是語音的合成。

語音識別是指我們自然發出的聲音需要機器轉換成語言符號,通過識別和理解過程把語音頻號轉變為響應的文字或命令,然後再與我們互動。語音識別技術可以應用在**銷售上,例如:公司新人特別多,沒有經驗,拿到單子的可能性很低。怎麼才能讓新人也能有很優秀的銷售能力呢?過去的做法是,把經驗總結成冊子,讓新人去背,很容易就忘了。但如果有了高精度的語音識別能力,就能識別出客戶在問什麼,然後在螢幕上告訴新人,該怎麼回答這個問題。

二、影象識別

計算機視覺

人類認識了解世界的資訊中大部分來自視覺,同樣,計算機視覺也成了機器認知世界的基礎,其終極目的就是讓計算機能像人一樣「看懂世界」。目前計算機視覺在人臉識別、影象識別、增強現實等方面有很好的應用,但也存在一定的挑戰。我們就拿谷歌的無人駕駛來說,通過機器視覺識別的技術路徑在現階段,仍有完全無法逾越的技術難題。

不談演算法,影象的攝取精度就是難關,即使最頂級的攝像裝置都無法達到人眼的細節獲取能力,看看最頂級的哈蘇相機配合最頂級鏡頭,在夜晚街頭短**時間下拍的**,對比人眼看到的影象就能看到差異,這還不談經濟上可行的低成本攝像裝置,視覺識別自動駕駛這個系統,眼睛就是近視眼。

而且如果下雨,灰塵等對分辨的影響都是很難解決的bug。如果配合雷達的話又有邏輯判斷優先的問題,信攝像頭,還是信雷達?會不會誤報?而作為雷射雷達,如果單純的車身自己也有同樣的邏輯判斷的問題,什麼樣的東西是有威脅的,什麼是無威脅的。什麼是潛在的威脅,這都不是計算機視覺這種單一智慧型所能解決的。因為**未來的感知能力,是人與機器最大的區別。

三、自然語言處理(nlp)

賢二機器僧

自然語言是人類智慧型的結晶。自然語言處理(nlp)是人工智慧中最為困難的問題之一。由於理解自然語言,需要關於外在世界的廣泛知識以及運用操作這些知識的能力,自然語言認知,同時也被視為乙個人工智慧完備(ai-complete)的問題。

其次,自然語言處理背後所依賴的是傳統的問答系統技術,即question answering(qa)。qa技術是自然語言處理中非常重要的乙個研究方向,原理是:對於輸入的問題首先做句法分析,從而理解問題或者指令的結構和意圖。比如如果使用者問的問題是某人出生在哪兒,那麼機器需要先對這句話進行解析,進而了解所要回答的應當是乙個地點,並且這個地點應當滿足某人出生與此的條件。

自然語言處理這塊相關落地的產品就很多啦。典型的代表就是聊天機械人,其中一類是以siri、amazon echo、微軟小娜、阿里天貓精靈、小公尺小ai音箱等為代表,偏向於工具性的服務型機械人。另一類則是以微軟小冰為代表的娛樂型機械人。第一類聊天機械人,以完成任務或回答事實性問題為導向,譬如你問天貓精靈「今天的天氣如何?」,或者給「小愛同學」下達「關閉臥室檯燈」等指令。第二類則以閒聊為導向,並不需要給出某乙個事實性問題的解答,只要交談自如、博君一笑即可。比如:北京龍泉寺的賢二機器僧。

四、使用者畫像

碟中諜6:全面瓦解

使用者畫像是根據使用者社會屬性、生活習慣和消費行為等資訊/資料而抽象出的乙個標籤化的使用者模型。構建使用者畫像的核心工作即是給使用者貼「標籤」——用資料來描述人的行為和特徵,而標籤是通過對使用者資訊分析而來的高度簡練的特徵標識。

人工智慧在使用者畫像裡最重要的作用就是找到相關性,給使用者打標籤。使用者標籤是表達人的基本屬性、行為傾向、興趣偏好等某乙個維度的資料標識,它是一種相關性很強的關鍵字,可以簡潔的描述和分類人群。比如好人和壞人、90後80後,星座、白領等。具體流程一般是從紛亂複雜、瑣碎的使用者行為流(日誌)中挖掘使用者在一段時間內比較穩定的特徵,即給使用者打上標籤。

舉例來說,如果你經常購買一些紙尿褲,那麼電商**即可根據母嬰購買的情況替你打上標籤「有孩子」,甚至還可以判斷出你孩子大概的年齡,貼上「有1-4歲的孩子」這樣更為具體的標籤,而這些所有給你貼的標籤組,就成了你的使用者畫像,也可以說使用者畫像就是判斷乙個人是什麼樣的人。但是今天的人工智慧雖然能夠找到相關性,但是卻無法找到內在的邏輯,因此容易把前提和結論搞反了。比如根據大資料的統計,喝咖啡的人比不喝咖啡的人長壽。但大資料沒告訴大家喝咖啡是不是原因,或許是生活水平高的人才有錢、有時間喝咖啡。所以真實的情況是長壽的人喝咖啡。

五、人工智慧演算法

深度學習演算法

說完了語音識別、影象識別和自然語言處理這些涉及互動的前端人工智慧技術, 我們再來說說後端人工智慧技術。後端的人工智慧技術指的就是人工智慧的核心演算法,包括深度學習演算法、記憶**模型演算法等。

首先,我們來說說深度學習演算法。我們知道2023年是人工智慧爆發的一年,先有alphago戰勝李世石,到了年底又有master連勝60場,橫掃中日韓圍棋高手,一時間**為之震驚。這個alpha go背後的deepmind團隊,用的就是深度增強式學習,這是深層神經網路用於決策領域的成果。深度學習是機器學習的乙個新領域,普遍認為深度學習的開創者是加拿大多倫多大學一位叫geoffrey hinton的教授,他是一位「神經科學家+計算機科學家」,他認為大腦是用全息的方式儲存外界世界資訊的,並且從上世紀80年代就開始研究用計算機系統架構來模擬人類大腦,就是我們今天說的深度學習的原型。

今天我們可以這樣理解深度學習演算法,深度學習就是運用神經網路一層又一層的計算來找到最優的引數,再結合引數去做出未來的決定。出發點在於建立、模擬人腦進行分析學習的神經網路。深度學習的整個學習過程中,幾乎可以做到直接把海量資料投放到演算法中,讓資料自己說話,系統會自動從資料中學習。從輸入到輸出是乙個完全自動的過程。深度學習演算法現在被設計成實現設計者既定目標的工具。比如,alphago的目標就是去贏得圍棋比賽,而不是去開車或幹其他事情。alphago不能自己設定自己的目標,如果要完成另乙個目標,就需要設計另一種機器。當然人工智慧有n多條路,深度學習演算法是目前人工智慧演算法裡表現最好的。但深度學習並不是一上來就好的,讓深度學習崛起還有兩個華人:

乙個就是斯坦福的教授,也是後來谷歌大腦的創始人吳恩達教授,因為他發現深度學習需要有更強的計算能力,所以他找到了英偉達的gpu(graphics processing unit,圖形處理單元),使得計算能力提公升了上百倍。

另外乙個人也是斯坦福的教授李飛飛,她建立了乙個影象識別資料庫。而且這個庫裡面的所有的影象都是標註過的,也就是說,如果圖里有山就會標註出山,如果有樹就標註出樹。這樣的話,你可以用這個圖形庫來訓練人工智慧系統,看它能不能識別出來這個圖形庫上面所標註的這些元素。經過這個影象庫的訓練,就可以訓練出視覺能力超過人的人工智慧系統。

但是千萬不要以為深度學習達到今天的水平就是無敵了,甚至可以超越人類了。深度學習發展起來的人工智慧系統存在乙個明顯的缺陷,就是他的過程無法描述,機器不能用人的語言說出來它是怎麼做到的。例如,alpha go打敗了李世石,你要問alphago是為什麼走這步棋,它是答不上來的。也就是說,我們沒辦法知道機器做事情的動機和理由。

要想更好的認識到人工智慧演算法的侷限性,需要引入乙個概念,就是認知複雜度。什麼是認知複雜度呢?就是指你建構「客觀」世界的能力。認知複雜度高的人,善於同時用互補,或者互不相容的概念來理解客觀世界,因為真實世界本身就不是非黑即白的。那麼對於機器來說,「認知計算」和「人工智慧」有啥關係呢?人工智慧的未來一般被分為三個發展方向:人搞定機器、機器搞定人和「人機共生」。而以「人機共生」為目標的人工智慧,就是認知計算。ibm在認知計算領域獲得了大量經驗,並且總結了認知計算的三個能力,分別是交流、決策,和發現。

(1)交流

第乙個能力是交流,認知計算可以處理非結構性的問題。很多用siri的人,只會把這當成娛樂功能,因為它不能保證交流內容的準確性,有時siri根本接不上你的話,因為你的話對它來說太複雜了。這個只能算作人工智慧比較初始的狀態。

而認知計算可以完全模仿人類的認知,你可以把它當做乙個孩子。就好像孩子周圍有一群逗他玩的大人,有人告訴孩子1+1=2,也有人說1+1=3。但是隨著孩子的成長,他自己會明白1+1=2才是對的。這就是非結構性問題。早期的人工智慧只能學會別人教給他的知識,但是認知計算可以處理模糊的,甚至是自相矛盾的資訊。

(2)決策

第二個能力是決策,我們都知道人工智慧可以分析複雜的邏輯,然後做出決策。認知計算可以更進一步,根據新的資訊來調整自己的決策。更厲害的是,認知系統所做的決策是沒有偏見的,而「毫無偏見的決策」對人類來說幾乎是一件不可能的事。比如說**癌症,這是典型的醫療決策場景。

癌症之所以難治,一方面由於這種疾病太過複雜,另一方面,醫生如果不能及時發現患者的癌症訊號,可能會延誤患者的**,或者導致診斷錯誤。而認知計算可以綜合分析複雜的醫療資料,還可以在醫生語言的上下文中解析含義,最後提出它的建議。

這就大大減少了醫生查病歷的時間,讓醫生能將更多的時間用在患者身上。2023年8月,《東京新聞》報道說,ibm研發的認知計算機械人「沃森」,就學習了海量的醫學**,只用了10分鐘,就為一名患者診斷出了很難判斷的白血病型別,還向東京大學醫科學研究所提出了適當的**方案。

(3)發現

第三個能力是發現,認知計算能發現新事物和新連線,填補人類思維的空白。比如在競爭激烈的餐飲業,怎樣才能做出令顧客滿意的新菜品呢?

認知系統可以整合區域知識、文化知識,還有各種食物搭配理論,幫助使用者發現想象不到的美食搭配。比如突然有一天,它會告訴你:用滷煮的配方做個披薩,可能很合你的胃口。你照著一做,發現還不錯!實際上,從2023年開始,ibm開發的「沃森大廚」,就已經學習了35000多種經典食譜,然後通過分析海量的食材搭配,結合化學、營養學等方面資料,為廚師和美食家帶來了超出人類想象的新型食譜。

認知計算可以幫助我們更好的交流、決策和發現。但是人工智慧依然有很多做不到的。例如:抽象能力,自我意識,審美,情感等。

六、小結

講了這麼多的人工智慧的能與不能。其實ai並不是魔法,它只是數學、統計學、以及使用大資料來進行模式識別,是對環境和物體的識別和相關性分析的智慧型。採用演算法的方式來實現人的邏輯和數學思維,形成計算機思維,從而衍生出特殊演算法系統,機器智慧型。

其實一切人工智慧問題其實就是硬體問題軟體化,用自動化的知識解決一切問題。比如說攝影,過去我們用各種光學鏡頭來讓**更美,現在用「演算法」我們就能搞定。再比如做實驗,過去我們要擺弄各種瓶瓶罐罐,而現在我們則可以在計算機裡模擬核**。

原文發布時間為:2018-05-28

人工智慧 人工智慧與人類智慧型的關係

1.基本概念界定 1.1人工智慧 人工智慧是在20世紀中期以後產生的學科,人工智慧就是用機器模擬人類的智慧型活動,從而用機器代替人類行使某些方面的職能。人工智慧是通過探索人的感覺和思維的規律來模擬人的智慧型活動,電子計算機是人工智慧的媒介和基礎。阿倫 圖靈說 如果一台計算機能騙過人,使人相信它是人而...

2018你不能錯過的人工智慧與OMT

看到這估計很多人都笑了,笑過之後我們不得不思考,時代進步真的太快了,我們稍不注意就可能被拋在後面,為了讓自己跟上時代的節奏,我們不得不學習,不得不接受新事物,不然可能真的就要變成這個社會的 局外人 了。那麼眼下什麼最火?那估計得是人工智慧與區塊鏈了。近年來,人工智慧與區塊鏈不斷地刺激著我們的眼球,衝...

人工智慧的炒作 外匯人工智慧(ai)行業現狀

外匯人工智慧 ai 行業現狀 在技術世界中,人工智慧或新近流行的流行語稱為ai,是後起之秀。人工智慧是全球幾乎所有公司的首選技術。現在,如果人工智慧成為 上的熱門話題,並且全世界的人們都在談論人工智慧,那麼就必須有一些我們需要了解和理解的東西。在本文中,我們將討論人工智慧和外匯業,如何在外匯業中使用...