樸素貝葉斯演算法

2022-08-31 08:24:07 字數 746 閱讀 2139

對於樸素貝葉斯演算法,我的理解就是:使用已知的概率和結果,來**事情的條件。舉乙個例子就是,我們通過統計得到了不同年齡段喜歡吃冰激凌的比例,比如各採訪了500個青少年、中年人和老年人,得到有450個青少年、300個中年人和50個老年人喜歡吃冰激凌。我們還通過統計,知道了在社會中假設小孩子佔20%,中年人50%,老人30%。

之前我們可能會問,乙個人喜歡吃冰激凌的概率是多少:這個肯定是20%90%+50%60%+30%*10%=51%.但現在問的問題是,如果乙個人喜歡吃冰激凌,那他是小孩的概率是多少呢?

為了回答這個問題,我們先看一下以下幾個概念:

先驗概率(prior probability)是指根據以往經驗和分析得到的概率.

比如這裡,小孩子在社會人口中佔比30%就是先驗概率。在演算法中,這些概率一般都是由統計歸納得出的。

後驗概率可以看做是條件概率的反向,就是如果事件y=y發生了,那麼x=x發生的概率。

而後驗概率也就是我們這個問題的答案,對於求解這個問題,我們有葉貝斯公式:

\(p(x=x|y=y)=\frac\)

也就是如果乙個人愛吃冰激凌,那麼他是小孩的概率等於(乙個人是小孩的概率*乙個人是小孩且她喜歡吃冰激凌的概率)也就是乙個人是乙個喜歡吃冰激凌的小孩的概率除以乙個人喜歡吃冰激凌的概率,也就是0.18÷0.51=0.35

其實如果把分母移動過去,這個公式的含義也十分明顯,兩邊都等於乙個人是喜歡吃冰激凌的小孩子的概率,只不過是把條件和結果反了過來而已。

關於公式更深一步的討論,可以參考樸素貝葉斯演算法的理解與實現

樸素貝葉斯演算法

首先樸素貝葉斯分類演算法利用貝葉斯定理來 乙個未知類別的樣本屬於各個類別的可能性,選擇可能性最大的乙個類別作為該樣本的最終類別。對於計算而言,需要記住乙個公式。p c x p x c p c p x 類似於概率論條件概率公式。其中x代表含義為最終類別,例如 yes?no。c為屬性。使用樸素貝葉斯演算...

樸素貝葉斯演算法

計算貝葉斯定理中每乙個組成部分的概率,我們必須構造乙個頻率表 因此,如果電子郵件含有單詞viagra,那麼該電子郵件是垃圾郵件的概率為80 所以,任何含有單詞viagra的訊息都需要被過濾掉。當有額外更多的特徵時,此概念的使用 利用貝葉斯公式,我們可得到如下概率 分母可以先忽略它,垃圾郵件的總似然為...

樸素貝葉斯

樸素貝葉斯演算法是一種基於概率統計的分類方法,它主要利用貝葉斯公式對樣本事件求概率,通過概率進行分類。以下先對貝葉斯公式做個了解。對於事件a b,若p b 0,則事件a在事件b發生的條件下發生的概率為 p a b p a b p b 將條件概率稍作轉化即可得到貝葉斯公式如下 p a b p b a ...