模式識別是什麼?
作為人工智慧的乙個重要方向,模式識別的主要任務是模擬人的感知能力,如通過視覺和聽覺資訊去識別理解環境,又被稱為「機器感知」或「智慧型感知」。
人們在觀察事物或現象的時候,常常要尋找它與其他事物或現象的不同之處,並根據一定目的把相似、但又細節不同的事物或現象組成一類。字元識別就是乙個典型的例子,如數字「4」可以有各種寫法,但都屬於同一類別。人腦具有很強的模式識別和推廣能力,即使對於某種不同寫法的「4」,以前雖未見過,也能把它分到「4」所屬的這一類別。人腦的這種對模式(事物、現象等)進行歸類和分類的能力,就是模式識別,也就是感知能力。
隨著20世紀40年代電子計算機出現,50年代人工智慧興起,模式識別在20世紀60年代初迅速發展成為一門新學科。21世紀以來,模式識別又逐漸與深度學習融合。近年來,深度學習和大資料的出現推動了模式識別的快速發展。
對此,劉成林解釋道,「模式識別是乙個智慧型任務,是人工智慧的一種形式。機器學習,包括深度學習是模式識別背後的基本方法,通過學習(訓練)使機器具備識別模式的能力。當前,用深度學習的方法來實現模式識別,能更好的解決問題。」
深度學習作為機器學習的一種,是對生物神經網路結構和資訊處理機制的簡單模擬。人工神經網路早在上世紀40年代就有人研究,50年代和80年代都曾產生較大的影響。近年來,隨著計算能力的提公升,可以訓練層數較多的神經網路(稱為深度神經網路)來提公升資料擬合和識別能力,有的甚至達到了1000多層。深度學習一般就是指利用深度神經網路來進行學習。
複雜條件下,人臉識別的正確率不到50%
得益於深度學習,目前人臉識別和文字識別都是人工智慧領域應用比較成功的方向,可以算是模式識別借助深度學習形成的主要研究成果之一。
但劉成林認為,目前人臉識別、文字識別雖然已應用得較為廣泛,但還不能算「應用得很好」。人臉識別目前應用得比較成熟的是門禁、通關等領域,原因在於被識別的物件能主動配合,距離攝像頭較近,能拍攝到比較清楚的影象。很多廠商在使用者配合、光照可控的場景下人臉識別正確率能達到99%以上。但在更加複雜的情況下,如在室外光照不均、距離遠、人臉視角多變情況下,用監控攝像頭進行人臉識別,識別正確率就會明顯降低。
目前在計算機前端加入ai模組,只能起輔助作用,複雜條件下的人臉識別依舊難以達到成熟應用的程度。劉成林表示,室外自然光照條件下,「人臉識別正確率還達不到50%」。
文字識別領域也是如此。文字識別目前主要應用在書籍和報紙等的數位化上。報紙、金融機構、保險機構以及快遞行業的的大量單據,都需要電子化後才能方便檢索、管理和進行大資料分析。司法界推行智慧型法務,辦案的文書(有印刷體,也有手寫體)需要電子化。醫院的病例、教育領域的作業題、考試答卷等,也都有很大的電子化需求。
同人臉識別一樣,影象清晰度和光照等問題也是文字識別的一大難點。平板掃瞄器由於光照均勻,對紙質材料掃瞄得到的影象清晰度高,文字識別率較高。而拍照的識別率則會降低,室外自然場景中的文字檢測和識別更是當今研究的熱點和難點問題。
對抗學習、腦科學並肩,加速ai程序
要克服人臉識別中低解析度和光照的問題,深度學習也存在侷限,而運用對抗學習的方法來處理影象則能提高其清晰度或生成更多樣本。
什麼是對抗學習?
對抗學習是一種很新的機器學習方法,由加拿大學者ian goodfellow首先提出。對抗學習實現的方法,是讓兩個網路相互競爭對抗,「玩乙個遊戲」。其中乙個是生成器網路,它不斷捕捉訓練庫里真實的概率分布,將輸入的隨機雜訊轉變成新的樣本(也就是假資料)。另乙個是判別器網路,它可以同時觀察真實和假造的資料,判斷這個資料到底是不是真的。通過反覆對抗,生成器和判別器的能力都會不斷增強,直到達成乙個平衡,最後生成器可生成高質量的、以假亂真的。
文字識別領域要解決的問題,除了上文提到的拍照、以及手寫筆跡的識別,小樣本條件下的文字識別,如古籍的識別也是一大挑戰,因為用於訓練的標記樣本不足,深度學習難以取得較高的識別率。
小樣本泛化性、自適應性、可解釋性、魯棒性是當前以深度學習為主的模式識別技術的主要侷限所在,而這些恰恰是人腦的長處。因此,模式識別可以從腦科學和神經科學上尋找新的借鑑,發展新的類人感知和認知機理的模式識別學習理論與方法。
以泛化能力為例,在訓練樣本較少時,可以設計與人的記憶方式類似的模型進行訓練,使機器記住文字的結構和關鍵特徵,如構成文字的筆畫、組合和關係。這種模型叫「生成模型」,可以記住每一類模式的關鍵特徵及分布,並能生成資料,如生成滿足一類文字基本結構、細節不同的手寫字。生成模型也具有很好的解釋性,在識別模式的同時能解釋這個模式是由哪幾部分構成的,幾部分之間是什麼關係。
模式識別、深度學習、對抗學習、腦科學……越來越多的人工智慧研究路徑進入了我們的視野。而對於人工智慧發展的未來,劉成林也認為,深度學習依然會是人工智慧研究的主流,但對抗學習、腦科學、認知科學等的理論方法,都會與其進行融合,共同推進人工智慧的發展。
hebbian theory-hebbian學習:hebbian學習是一種神經科學理論,它認為突觸後細胞敏感度的增加源於突出前細胞對突出後細胞反覆或者持續的刺激。這一理論解釋了突觸的可塑性,即學習過程中大腦神經元的適應性,也對人工神經網路的研究起到了重要的作用。它也可稱為hebb規則或hebb假設
什麼是模式識別,對抗學習是什麼?
模式識別是什麼?作為人工智慧的乙個重要方向,模式識別的主要任務是模擬人的感知能力,如通過視覺和聽覺資訊去識別理解環境,又被稱為 機器感知 或 智慧型感知 人們在觀察事物或現象的時候,常常要尋找它與其他事物或現象的不同之處,並根據一定目的把相似 但又細節不同的事物或現象組成一類。字元識別就是乙個典型的...
模式識別 統計模式識別(6)
上一節,我們討論了最小錯誤率分類器,接下來這一節我們將討論最小風險bayes分類器。1.問題提出 1.最小錯誤率bayes決策的最小錯誤率 概率意義上最優,在工程上是否是最優?2.錯誤分類的結果 代價或風險會是怎樣的?考慮癌細胞影象識別的例子 3.出錯的可能情況 正常細胞 1錯分為異常 2,異常細胞...
模式識別 統計模式識別(7)
上兩節我們介紹了最小錯誤率和最小風險bayes分類器,接下來談談最小最大決策。1.問題提出 假設c 2 現在我們假定一種情況,先驗概率未知或者不確定的前提,在這種前提下,絕對意義的最小風險不存在,這種情況下我們怎麼求bayes分類器。2.求解思路 雖然p 1 和p 2 未知,但我們可以假設他們確定,...