模式識別課程筆記(一)

2021-07-29 09:57:56 字數 2413 閱讀 6348

閱讀目錄

一、模式識別(pattern recognition)

二、模式識別型別

三、模式識別系統

四、評價標準

一、模式識別(pattern recognition)

人類在識別和分辨事物時,往往是在先驗知識和以往對此類事物的多個具體例項觀察基礎上產生的整體性質和特徵的認識。

其實,每一種外界事物都可以看作是一種模式,人們對外界事物的識別,很大部分是把事物進行分類來完成的。

中文中:模式==類

簡單來說就是一種規律,識別主是對事物物件進行分門別類,模式識別可以看作對模式的區分和認識,是事物樣本到類別的對映;

英文中:pattern則表示兩層意思

一層代表事物的模板或原形,第二層則是表徵事物特點的特徵或性狀組合。

在模式識別學科中,模式可以看做是物件的組成成分或影響因素間存在的規律性關係,或者是因素間存在的確定性或隨機性規律的物件、過程或事件的集合。

因此,也有人把模式成為模式類,模式識別也被稱作為模式分類(pattern classification)。

專業術語:

樣本(sample),乙個個體物件,注意與統計學中的不同,類似於統計學中的例項(instance);

樣本集(sample set):若干樣本的集合,統計學中的樣本就是指樣本集;

類或類別(class):具有相同模式的樣本集,該樣本集是全體樣本的子集;

習慣性地,我們用w1,w2等來表示類別,兩類問題中也會用或;

特徵(feature):也稱為屬性,通常指樣本的某些可以用數值去量化的特徵,如果有多個特徵,則可以組合成特徵向量(feature vector)。樣本的特徵構成了樣本特徵空間,空間的維數就是特徵的個數,每乙個樣本就是特徵空間中的乙個點。

已知樣本(known sample):已經事先知道類別的樣本;

未知樣本(unknown sample):類別標籤未知但特徵已知的樣本;

二、模式識別型別

1.監督模式識別 

特點:要劃分的類別是已知的,並且能夠獲得一定數量的類別已知的訓練樣本。 

這種情況下的機器學習的過程稱為監督學習(有導師學習)。

2.非監督模式識別 

特點:事先並不知道要劃分的類別有哪些,甚至可能連要劃分類別的數目也不知道,並且沒有任何已知樣本可以用來訓練。 

這種情況下要根據提取到的樣本特徵將樣本聚成幾個類,屬於同一類的樣本從某個角度上看具有一定的相似性,而不同類之間的樣本差異則較大。這種機器學習的過程稱為非監督學習(無導師學習),也成為聚類。

需要注意的是,在很多非監督模式識別中,聚類的結果不是唯一的,因為「相似」是從某個角度看上去的相似,這裡的角度就是前面提到的特徵。根據樣本特徵向量中的不同特徵去聚類,會得到不同的結果。

舉個例子:假設提取到的4個樣本y1,y2,y3,y4的特徵向量分別為 

x1=(red,rounded,hollow) 

x2=(red,rectangular,hollow) 

x3=(blue,rounded,solid) 

x4=(blue,rectangular,hollow)

若按特徵向量的第乙個特徵(顏色)去聚類時,y1,y2聚為一類,y3,y4聚為一類;若按第二個特徵(形狀)去聚類時,y1,y3聚為一類,y2,y4聚為一類;若按第三個特徵(空心/實心)去聚類時,y1,y2,y4聚為一類,y3自成一類。

這很好的解釋了聚類結果的非唯一性,這也是非監督模式識別與監督模式識別的乙個重要差別。

監督學習 非監督學習

有導師 無導師

要劃分的類別已知 事先不知要劃分類別

訓練中可知模型決策結果 不知是否有錯

神經網路、決策樹 k-均值聚類法

3. 加強學習

不提供設計種類,基於導師提供試驗反饋(如決策是否正確)

三、模式識別系統

乙個模式識別系統的典型構成包括:預處理,特徵選擇與提取,分類或聚類,後處理四個主要部分。

例子:假設有兩種魚:鱸魚、鮭魚

問題:在傳送帶上分類

步驟:感知(sensing)

格式化能被機器感知的物件

可能導致的問題:

光線條件,魚的位置,相機噪音等等

預處理(preprocessing)

改善資料

特徵提取(feature extraction)

什麼樣的特徵可以區分不同種類

分類(classification)

支援向量機、決策樹等

模式識別系統

資料獲取&感知

測量物理變數

基於樣本質量,只有典型樣本有用,時間和成本是限制條件

預處理移除噪音、隔離背景

特徵提取

模式學習/估計

學習特徵與模式類別的對映關係

分類輸出處理

四、評價標準

訓練精度

過擬合問題

測試精度

詳細資料,**群獲取:586656942

模式識別課程學習筆記(一)

本意 提供模仿用的 完美的標本。pr領域定義 存在於空間和時間中可觀測事物的全體。個人理解 可以通過各種手段獲取與採集 到的事物。模式類 由彼此相似的模式構成的集合。物以類聚,人以群分 模式類別 賦予每個模式類的識別符號。個人理解就是所屬模式類的標籤 觀測樣本 被觀測事物的分布資訊。試驗 為獲取觀測...

模式識別課程問答(一)

為了能讓機器執行和完成識別任務,必須對分類識別物件進行科學的抽象,建立它的數學模型,用以描述和代替識別物件,這種物件的描述即為模式。表現形式有特徵向量 符號串 圖 關係式。模式識別是指根據研究物件的特徵或屬性,運用一定的分析演算法認定其類別,並且分類識別的結果應盡可能地符合真實。具有視覺的機械人 包...

SVM 1 模式識別課堂筆記

引言 當兩類樣本線性可分時,針對我們之前學習的感知機而言,存在多個超平面能將資料分開,這裡要討論什麼樣的分類面最好的問題。為此,我們形式化的定義了最優分類超平面,他有兩點特徵 1.能將訓練樣本沒有錯誤的分開 2.在樣本中距離超平面最近的樣本與超平面之間的距離最大。1.沒有錯誤的分開 對尺度影響的消除...