我的理解:
生成模型相當統計全國男女比例,
判別模型相當於抽樣分析乙個省的男女比例作為全國男女比例
假設你現在有乙個分類問題,x是特徵,y是類標記。用生成模型學習乙個聯合概率分布p(x,y),而用判別模型學習乙個條件概率分布p(y|x)。
用乙個簡單的例子來說明這個這個問題。假設x就是兩個(1或2),y有兩類(0或1),有如下如下樣本(1,0)、(1,0)、(1,1)、(2,1)
則學習到的聯合概率分布(生成模型)如下:
-------0------1----
--1-- 1/2---- 1/4
--2-- 0 ------1/4
而學習到的條件概率分布(判別模型)如下:
-------0------1----
--1-- 2/3--- 1/3
--2-- 0--- 1
在實際分類問題中,判別模型可以直接用來判斷特徵的類別情況,而生成模型,需要加上貝耶斯法則,然後應用到分類中。但是,生成模型的概率分布可以還有其他應用,就是說生成模型更一般更普適。不過判別模型更直接,更簡單。
最後說一說兩種模型的優缺點:
生成模型:
優點:1)生成給出的是聯合分布
2)生成模型收斂速度比較快,即當樣本數量較多時,生成模型能更快地收斂於真實模型。
3)生成模型能夠應付存在隱變數的情況,比如混合高斯模型就是含有隱變數的生成方法。
缺點:1)天下沒有免費午餐,聯合分布是能提供更多的資訊,但也需要更多的樣本和更多計算,尤其是為了更準確估計類別條件分布,需要增加樣本的數目,而且類別條件概率的許多資訊是我們做分類用不到,因而如果我們只需要做分類任務,就浪費了計算資源。
2)另外,實踐中多數情況下判別模型效果更好。
判別模型:
優點:1)與生成模型缺點對應,首先是節省計算資源,另外,需要的樣本數量也少於生成模型。
2)準確率往往較生成模型高。
3)由於直接學習
缺點:
1)是沒有生成模型的上述優點。
生成模型和判別模型
監督學習的結果是得到乙個分類或 模型,應用該模型可以對給定輸入 x 得到相應的輸出 y,即 y f x 或者p y x 根據不 同類對應 的後驗概 率判斷所 屬類別 根據模型是否表示了x 到 y的生成過程將模型分為兩種,生成方式 判別方式。生成模型p y x p x y p x 如樸素貝葉斯法 隱馬...
生成模型和判別模型
監督學習的任務就是學習乙個模型,應用這一模型,對給定的輸入 相應的輸出,這一模型的一般形式為決策函式 y f x 或者條件概率分布 p y x 監督學習方法有可以分為生成方法和判別方法,所學到的模型分別稱為生成模型和判別模型 生成方法由資料學習聯合分布概率p x,y 然後求出條件概率分布p y x ...
生成模型和判別模型
監督學習的任務是學習乙個模型,應用這一模型,對於給定的輸入 相應的輸出。這個模型的一般形式為決策函式 y f x y f x y f x 或者為條件概率分布 p y x p y x p y x 監督學習方法又可以分成生成方法和判別方法 學習到的相應模型為生成模型和判別模型。生成方法由資料學習聯合概率...