模式識別技術漫談(1)
------引言
在人工智慧技術(artificial intelligence)
領域中,模式識別
(pattern recognition)
技術也許是最具有挑戰性的一門技術了,模式識別有時又被稱為分類技術,因為模式識別說到底就是對資料進行分類。說到識別,最為常用的便是模仿人的視覺的影象識別(當然還有語音識別),也許你會想當然地認為那還不簡單,覺得我們用我們的眼睛可以輕而易舉地識別出各種事物,但是當你想用計算機中的程式來實現它時,於是你便會覺得很沮喪,甚至於有無從下手的感覺,至此你再也不會覺得電腦有多聰明,你會覺得電腦是多麼的低能。是的,現在的電腦智慧型,即人工智慧還遠不如蟑螂的智慧型,這其中最為根本的原因是模式識別技術還是處於較為低層次的發展階段,很多的識別技術還無法突破,甚至有人還斷言,再過
30年也不會有本質的飛躍。當然,世事總是讓人難以預料,我們也用不著這麼地悲觀,科學技術總是向前發展的,沒有人可以阻檔得了的。在這裡,我把我對模式識別技術的學習和研究心得拿出來與大家分享一下,我唯一的目的是想讓模式識別技術走下技術的神壇,讓每個人都能夠去了解它,更是想讓更多的人有興趣去研究它,我的知識和能力有限,這樣也許還能夠幫助我改正我的錯誤認識。
模式識別具有較長的歷史,在
20世紀
60年代以前,模式識別主要是限於統計學領域中的理論研究,還無法有較強的數學理論支援,
20世紀
80年代神經網路等識別技術得到了突破,計算機硬體技術更是有了長足的發展,模式識別技術便得到了較為廣泛的應用,光學字元識別
(ocr)
是模式識別技術最早得到成功應用的技術,之後的應用還有如
dna序列分析、化學氣味識別、影象理解力、人臉檢測、表情識別、手勢識別、語音識別、影象資訊檢索、資料探勘等。
模式識別是一門與數學結合非常緊密的科學,所應用到的數學知識非常多,最基本的便是概率論和數理統計了,模式識別技術到處都充滿了概率和統計的思想,我們經常所說的識別率,其實就是概率的表達:在大資料量(嚴格地說應當是資料量無窮大)測試中識別成功的概率,還有常用的貝葉斯決策分類器便是運用了概率公式。模式識別還用到了線性代數,因為運用線性代數可以較為方便表達具有多特徵的事物,我們一般會用向量來表達乙個事物的特徵,對於向量的計算是一定會用到線性代數的知識的。還有乙個較為高層次的數學知識是泛函分析,泛函分析是
研究無限維線性空間上的泛函式和運算元理論,
svm(支援向量機)便是以泛函分析中的理論為基礎的,
svm技術還運用到了最優化理論數學知識,最近中科院王守覺院士提出的多維空間仿生模式識別技術是以拓撲學為理論基礎的。所以說模式識別科學是應用到數學知識最多的一門學科之一,在我們研究模式識別技術過程中會碰到乙個又乙個的數學知識,有時需要我們重新拿起讀大學時的數學書來學習,有時還需要我們去尋找和學習我們也許從未學習過的數學知識,這時你會感覺到你真的是在做研究,彷彿又回到了大學學習時光,你更會感覺到要學好模式識別技術需要多年的積累,浮躁不得,當然,如果你越是堅持下來,你的價值就會越大,因為這是個可以不斷得到積累的技術,不象研究上層應用,研究多年並不意味著你就會有多厲害,一下子沒有跟進便會被淘汰掉,而後面進來研究的人很容易超越前面研究的人,所以說,模式識別技術是乙個喜歡做研究的人的乙個很好的選擇。
模式識別 句法模式識別(1)
圖形或影象目標的形狀或結構千變萬化,目標 模式 的差異也在於其形狀或結構的不同,這種模式稱為結構模式,基於形狀或結構的模式識別稱為結構模式識別。數字影象處理學中,鏈碼是描述目標邊緣和輪廓的常用的編碼方法。用字元或符號的來表示影象目標的區域性邊緣的走向。freeman鏈碼 影象像元之間邊緣的走向用方向...
模式識別入門(1)
1 感測器 2 分割器 如影象分割,把要識別的物體從混合物體中分離開 3 特徵提取器 提取到的特徵要保證同類不同樣本之間特徵值應該非常接近,不同類的樣本之間的特徵值有很大的差異p 還要 保證三個不變性 a.空間旋轉不變性 如物體在相機的不同角度拍攝得到的特徵的不變 b.平移不變性 c.尺度不 變性 ...
模式識別 統計模式識別(6)
上一節,我們討論了最小錯誤率分類器,接下來這一節我們將討論最小風險bayes分類器。1.問題提出 1.最小錯誤率bayes決策的最小錯誤率 概率意義上最優,在工程上是否是最優?2.錯誤分類的結果 代價或風險會是怎樣的?考慮癌細胞影象識別的例子 3.出錯的可能情況 正常細胞 1錯分為異常 2,異常細胞...