已知樸素貝葉斯公式:
$p(c|f_1,f_2,…, f_n) =\fracp(c) \prod_^ p(f_i|c)$
其中,$f_i$ 表示樣本的第 $i$ 個特徵,$c$ 為類別標籤。$p(f_i | c)$ 表示樣本被判定為類別 $c$ 前提下,第 $i$ 個特徵的條件概率。
之前,對於 $p(f_i |c)$ 我們用頻率來作為概率的估計,就如同上面例子中做的那樣。
現在我們要採用另外一種方式,通過該特徵在資料樣本中的分布來計算該特徵的條件概率。
首先先明確一下符號:
我們假設:
$p(x_i | c)$ 具有特定的形式,這個具體的形式是事先就已經認定的,不需要求取。
$p(x_i | c)$ 被引數 $
樸素貝葉斯分類器
p a b frac 類別 結果 a出現在特徵b樣本裡的概率 frac 假設乙個學校裡有60 男生和40 女生。女生穿褲子的人數和穿裙子的人數相等,所有男生穿褲子。隨機看到了乙個穿褲子的學生,那麼這個學生是女生的概率是多少?begin 特徵 穿褲子 類別 女生 p 女生 穿褲子 frac frac ...
樸素貝葉斯分類器
樸素貝葉斯分類器是用來做分類的乙個簡便方法。在貝葉斯公式的基礎上,引人條件獨立的假設,使得貝葉斯分類器具有簡單易行的優點和假設時常與實際不符的缺點。下面簡單介紹一下樸素貝葉斯分類器。首先規定一下資料格式 輸入的每乙個樣本為 其中 i 為樣本編號,x 為樣本的特徵,是乙個 n 維向量,x cdots ...
樸素貝葉斯分類器
所謂 條件概率 conditional probability 就是指在事件b發生的情況下,事件a發生的概率,用p a b 來表示。根據文氏圖,可以發現 同理可得,所以,即 其中,p a 稱為 先驗概率 prior probability 即在b事件發生之前,我們對a事件概率的乙個判斷 p a b ...