樸素貝葉斯演算法規則

2021-08-05 23:58:58 字數 1375 閱讀 8910

先從乙個例子出發,引出如何計算後驗概率。假設你患有癌症的概率為

p(cancer) = 0.01
而你去醫院檢測到的出現結果的概率為

當你有癌症時,有90%的概率檢測到你有癌症(positive)

當你沒有癌症時,有90%的概率檢測到你沒有癌症(negative)

那麼問題來了:如果你去醫院檢測到有癌症,你實際有癌症的概率是多少咧?即,

p(cancer|positive) = ?
其實就是一條公式

先驗概率 * 測試結果出現(positive或negative)概率 = 後驗概率
p(cancer) = 0.01

p(no cancer) = 1 - p(cancer) = 0.99

有癌症的情況下,不同檢測結果出現的概率為

p(positive | cancer) = 0.9

p(negative | no cancer) = 0.9

p(negative | cancer) = 1 - p(negative | no cancer) = 0.1

將概率和先驗概率列出來後,可以開始進行計算,先求聯合概率

p(cancer, positive) = p(cancer) * p(positive | cancer) = 0.01 * 0.9 = 0.009

p(no cancer, positive) = p(no cancer) * p(negative | no cancer) = 0.99 * 0.1 = 0.099

這一步英文叫normalize

p(positive) = p(cancer, positive) + p(no cancer, positive) = 0.108
這裡根據一開始的公式,很簡單就可以求解了

p(cancer|positive) = p(cancer, positive) / p(positive) = 0.009 / 0.108 = 0.0833

p(no cancer|positive) = p(no cancer, positive) / p(positive) = 0.099 / 0.108 = 0.9167

這時,p(cancer|positive)p(no cancer|positive)加起來應該是1

p(cancer|positive) + p(no cancer|positive) = 1
以上就是整個樸素貝葉斯的演算法規則

樸素貝葉斯演算法

首先樸素貝葉斯分類演算法利用貝葉斯定理來 乙個未知類別的樣本屬於各個類別的可能性,選擇可能性最大的乙個類別作為該樣本的最終類別。對於計算而言,需要記住乙個公式。p c x p x c p c p x 類似於概率論條件概率公式。其中x代表含義為最終類別,例如 yes?no。c為屬性。使用樸素貝葉斯演算...

樸素貝葉斯演算法

計算貝葉斯定理中每乙個組成部分的概率,我們必須構造乙個頻率表 因此,如果電子郵件含有單詞viagra,那麼該電子郵件是垃圾郵件的概率為80 所以,任何含有單詞viagra的訊息都需要被過濾掉。當有額外更多的特徵時,此概念的使用 利用貝葉斯公式,我們可得到如下概率 分母可以先忽略它,垃圾郵件的總似然為...

樸素貝葉斯演算法

對於樸素貝葉斯演算法,我的理解就是 使用已知的概率和結果,來 事情的條件。舉乙個例子就是,我們通過統計得到了不同年齡段喜歡吃冰激凌的比例,比如各採訪了500個青少年 中年人和老年人,得到有450個青少年 300個中年人和50個老年人喜歡吃冰激凌。我們還通過統計,知道了在社會中假設小孩子佔20 中年人...