樸素貝葉斯演算法

2021-08-09 17:34:51 字數 714 閱讀 2543

首先樸素貝葉斯分類演算法利用貝葉斯定理來**乙個未知類別的樣本屬於各個類別的可能性,選擇可能性最大的乙個類別作為該樣本的最終類別。

對於計算而言,需要記住乙個公式。p(c|x)=p(x|c)p(c)/p(x)類似於概率論條件概率公式。其中x代表含義為最終類別,例如:yes?no。c為屬性。

使用樸素貝葉斯演算法**未知樣本x=屬性play為yes還是no?

**未知屬性是yes or no 當然需要比較其概率。利用樸素貝葉斯演算法的求解過程如下:

p(play=yes|x)=p(play=yes)*p(play=yes)=p(x1|play=yes)*p(x2|play=yes)*p(x3|play=yes)*p(x4|play=yes)*p(play=yes)

其中p(play=yes)是指yes在全部play ball中的概率為 9/14

p(x1|play=yes)是指x中第乙個rain屬性的的概率為 (在rain屬性下yes的概率)*(rain屬性在其outlook類下的概率)/p(play=yes)=(3/5)*(5/14)/(9/14)=3/9;

依次求解剩餘概率。最後相乘得到p(play=yes|x)的概率為 0.0211

同樣方法求解p(play=no|x),與p(play=yes|x)比較大小。概率大的為最終類標號。

樸素貝葉斯演算法

計算貝葉斯定理中每乙個組成部分的概率,我們必須構造乙個頻率表 因此,如果電子郵件含有單詞viagra,那麼該電子郵件是垃圾郵件的概率為80 所以,任何含有單詞viagra的訊息都需要被過濾掉。當有額外更多的特徵時,此概念的使用 利用貝葉斯公式,我們可得到如下概率 分母可以先忽略它,垃圾郵件的總似然為...

樸素貝葉斯演算法

對於樸素貝葉斯演算法,我的理解就是 使用已知的概率和結果,來 事情的條件。舉乙個例子就是,我們通過統計得到了不同年齡段喜歡吃冰激凌的比例,比如各採訪了500個青少年 中年人和老年人,得到有450個青少年 300個中年人和50個老年人喜歡吃冰激凌。我們還通過統計,知道了在社會中假設小孩子佔20 中年人...

樸素貝葉斯

樸素貝葉斯演算法是一種基於概率統計的分類方法,它主要利用貝葉斯公式對樣本事件求概率,通過概率進行分類。以下先對貝葉斯公式做個了解。對於事件a b,若p b 0,則事件a在事件b發生的條件下發生的概率為 p a b p a b p b 將條件概率稍作轉化即可得到貝葉斯公式如下 p a b p b a ...