樸素貝葉斯公式的理解和應用

2021-09-29 19:55:25 字數 932 閱讀 9156

樸素貝葉斯

2019.11.21

貝葉斯方法是乙個歷史悠久,有著堅實的理論基礎的方法,同時處理很多問題時直接而又高效,很多高階自然語言處理模型也可以從它演化而來。因此,學習貝葉斯方法,是研究自然語言處理問題的乙個非常好的切入口。

貝葉斯公式就一行:

而它其實是由以下的聯合概率公式推導出來:

其中p(y)叫做先驗概率,p(x|y)叫做後驗概率,p(y,x)叫做聯合概率。

結論 p(x,y)聯合概率 ==p(y)先驗概率 ×p(x|y)後驗概率

沒了,貝葉斯最核心的公式就這麼些。

下面是對貝葉斯的一些理解

p(x,y)聯合概率,即x,y同時發生的概率。

p(x,y)聯合概率,xy同時發生的概率=p(x)x發生的概率 ×   p(y|x) x條件下y發生的概率  

p(x,y)聯合概率,xy同時發生的概率=p(y)y發生的概率 ×    p(x|y) y條件下x發生的概率 

以p(x,y)=p(y|x)*p(x)=p(x|y)*p(y)

在乙個大的統計樣本之中  p(x),p(y),p(x|y)  p(y|x)的概率都是可以從樣本中統計得來  所以一切都變得可以計算,我們假設所有的樣本 都符合這樣的xy 聯合分布  那麼就可以計算出我們想要的結果  比如在p(y|x) 在x特徵下屬於y的概率

p(x)= x特徵的總樣本/ 所有樣本

p(y|x)= x特徵中屬於y的樣本數量/x特徵所有樣本

p(y) = 屬於y類的樣本/所有樣本

p(x|y)=y類中有x特徵的樣本/y的總樣本

以下是我的理解過程:

條件概率,全概率公式,貝葉斯公式,樸素貝葉斯

本文摘自黃清龍等編著的 概率論與數理統計 我們以乙個例子來闡述樸素貝葉斯思想。例子來自樸素貝葉斯分類 原理 假設根據以前的經驗獲得如下的資料。然後給你乙個新的資料 身高 高 體重 中 鞋碼 中 請問這個人是男還是女?判斷是男還是女,是分類問題,記男為c1,女為c2。身高體重鞋碼是樣本x的屬性,記x1...

樸素貝葉斯

樸素貝葉斯演算法是一種基於概率統計的分類方法,它主要利用貝葉斯公式對樣本事件求概率,通過概率進行分類。以下先對貝葉斯公式做個了解。對於事件a b,若p b 0,則事件a在事件b發生的條件下發生的概率為 p a b p a b p b 將條件概率稍作轉化即可得到貝葉斯公式如下 p a b p b a ...

樸素貝葉斯

1.準備資料 從文字中構建詞向量 2.訓練演算法 從詞向量計算概率 3.測試演算法 儲存為 bayes.py 檔案 參考 coding utf 8 from numpy import 文字轉化為詞向量 def loaddataset postinglist my dog has flea probl...