機器學習第二次作業

模式識別的形式

回歸回歸是分類的基礎，離散的類別值由回歸值做判別決策得到。

特徵的特性

特徵向量的相關性

投影殘差向量

歐氏距離

機器學習流程圖

目標函式的作用：引數可能沒有準確解或有無數解，所以要確定近似解

機器學習的方式

無監督式學習：不給定輸出真值（更難）

半監督式學習

強化學習：機器自行探索決策、真值滯後反饋的過程

誤差泛化能力

模型不僅對訓練樣本有決策能力，也對新的模式有決策能力。

提高泛化能力：

正則化：在目標函式中加入正則項

模型評估方法

k折交叉驗證

留一驗證

效能指標

類的原型

代表這個類的乙個模式或一組量

最近鄰距離度量

標準：方式：

med分類器

最小歐氏距離分類器

決策邊界：超平面，垂直平分兩個類原型的連線

特徵正交白化

去除特徵方差不同和特徵相關性

白化：尺度變換，使各維方差相同

micd分類器

最小類內距離分類器（馬氏距離）

決策邊界：

缺陷：

會選擇方差較大的類

原因：僅考慮觀測到的訓練樣本的分布情況，沒有考慮類的分布等先驗知識

後驗概率 p(c|x)

給定模式x屬於類c的可能性

貝葉斯規則

map分類器

最大後驗概率分類器

決策邊界：

決策誤差

未選擇的類所對應的後驗概率

觀測概率

高維高斯分布

損失當前決策動作相對於其他候選類別的風險程度

假定x屬於cj，決策動作αi的損失：λ(αi|cj)，簡稱λij

可以用矩陣表示

決策風險

定義：所有候選類別的期望損失

貝葉斯分類器

決策風險最小

最小化期望損失：對每個測試樣本選擇風險最小的類

樸素貝葉斯分類器

特徵是多維的，假定特徵之間是獨立的

拒絕選項

引入閾值τ，後驗概率小於τ的決策會被拒絕

τ∈(1/k,1)

第一節課上，了解了很多模式識別和機器學習領域的應用，意識到機器學習技術與人們日常生活的密切聯絡，比如無人駕駛，文字識別，人臉識別，****等等各種應用，才發現在智慧型裝置如此普及的現在，人們的生活早已離不開機器學習技術的支撐，明白了機器學習的重要性。之後，在老師深入淺出的講解下，從機器學習的基本概念和原理，到分類器的講解以及優化，我了解了越來越多的知識。

同樣的，這門課也讓我明白了基本功的重要。。由於對之前線代、高數等知識的淡忘，在一些公式推導方面，學習的有些吃力。而課本又都不在家裡，沒法隨時查閱相關知識，所以對公式這方面學習的確實不怎麼紮實，以後肯定還要回過頭來再看幾遍才能掌握。。

機器學習第二次作業

機器學習第二次作業

機器學習第二次作業

第二次作業

相關推薦