《統計學習方法》學習筆記 生成模型與判定模型

2021-08-22 16:10:12 字數 1165 閱讀 1736

監督學習的任務就是學習乙個模型,應用這一模型,對給定的輸入**對應的輸出。這個模型的一般形式為決策函式: y=

f(x)

y =f

(x

)或者條件概率分布: p(

y|x)

p (y

|x

)監督學習方法又可以分為生成方法和判別方法,所學到的模型稱為生成模型和判別模型。

生成方法由資料學習聯合概率分布p(

x,y)

p (x

,y

),然後求出條件概率分布p(

y|x)

p (y

|x

)作為**的模型,即生成模型: p(

y|x)

=p(x

,y)/

p(x)

p (y

|x)=

p(x,

y)/p

(x

)這樣的方法之所以稱為生成方法,是因為模型表示了給出輸入x產生輸出y的生成關係。典型的生成模型有:樸素貝葉斯法和隱馬爾科夫模型。

判別方法由資料直接學習決策函式f(

x)f (x

),或者條件概率分布p(

y|x)

p (y

|x

)作為**模型,即判別模型。判別方法關心的是對於給定的輸入x x

,應該**什麼樣的輸出

y' role="presentation">y

y,典型的判別模型包括k近鄰法,感知機,決策樹,邏輯斯帝回歸模型,最大熵模型,支援向量機,提公升方法和條件隨機場等。

生成方法的特點:生成方法可以還原出聯合概率分布p(

x,y)

p (x

,y

),而判別方法不能;生成方法的學習收斂速度更快。即當樣本容量增加時,學到的模型可以更快的收斂於真是模型;當存在隱變數時,仍可以用生成方法學習,此時判別方法就不能用。

判別方法的特點:判別方法直接學習的是條件概率

p(y|x})

p(y|x})

或決策函式f(

x)f (x

),直接面對**,往往學習的準確率更高;由於直接學習

p(y|x})

p(y|x})

或f(x) f(x

),可以對資料進行各程度上的抽象、定義特徵並使用特徵,因此可以簡化學習問題。

《統計學習方法》學習筆記

最近把李航的 統計學習方法 看完了,感覺很不錯,從概論到各個統計方法,由易到難層層推進,每個方法都有詳盡的數學公式推倒,感覺很適合有一定數學功底的人作為機器學習入門來看。可惜本人自幼愚鈍,資質欠佳,以前學的概率論與數理統計的知識都忘得差不多了,看得雲裡霧裡的,前面還好,越到後面越看不明白,遇到不懂的...

統計學習方法 學習筆記(1)

統計學習方法的三要素 模型 策略和演算法,統計學習的物件是資料 方法 模型 策略 演算法。監督學習,也就是利用訓練資料學習乙個模型,在用這個模型對測試樣本進行 而由於訓練資料是由人為提供的,所以稱之為監督學習。1 模型 模型即是假設空間對應的條件概率或者是決策樹函式。2 策略 這裡引入了損失函式和風...

李航 統計學習方法 學習筆記 1 統計學習方法概論

1.4 模型評估與模型選擇 1.5 其他.考研終於告一段落,接下來是安心等待入學。想利用這段時間系統學習一下機器學習基礎,簡單記錄一下自己的學習過程,也算是對自己的一種監督。下面詳細介紹一下 策略 首先引入損失函式與風險函式的概念。損失函式度量模型一次 的好壞,風險函式度量平均意義下模型 的好壞。統...