本文摘自黃清龍等編著的《概率論與數理統計》
我們以乙個例子來闡述樸素貝葉斯思想。例子來自樸素貝葉斯分類:原理
。假設根據以前的經驗獲得如下的資料。然後給你乙個新的資料:身高「高」、體重「中」,鞋碼「中」,請問這個人是男還是女?
判斷是男還是女,是分類問題,記男為c1,女為c2。身高體重鞋碼是樣本x的屬性,記x1為身高,x2為體重,x3為鞋碼。我們問題是,已知樣本x的屬性,求它最有可能屬於哪一類。也就是說樸素貝葉斯分類法**x屬於ci類,當且僅當
p(ci|x)>p(cj|x),1<= j <=2,j!=i
這樣,最大化p(ci|x)。使p(ci|x)最大的類ci稱為最大後驗假設。根據貝葉斯公式:
由於p(x)對於所有類為常數,所以只需要p(x|ci)p(ci)最大即可。
打斷一下,其實在這裡,貝葉斯公式可以這樣理解:
回到正題,現在我們需要計算的一項是p(x|ci),但是包含三個屬性,每個屬性的size是3,總共是9維空間。這還是簡化之後的情況,現實生活中的情況屬性和維數會更高很多,這將使得計算p(x|ci)變得很困難,因此有了樸素貝葉斯假設:屬性之間相互獨立,即p(x|ci)=p(x1|ci)·p(x2|ci)·p(x3|ci)。關於樸素貝葉斯假設可參考帶你理解樸素貝葉斯分類演算法,這篇文章講的很詳細。
在本例中,新的樣本的屬性是x1=高,x2=中,x3=中。
p(x1|c1)=0.5,p(x2|c1)=0.5,p(x3|c1)=0.25,p(c1)=0.5,---> p(x|c1)p(c1)=0.5*0.5*0.25*0.5=0.03125
p(x1|c2)=0,p(x2|c2)=0.5,p(x3|c2)=0.5,p(c2)=0.5,---> p(x|c1)p(c1)=0*0.5*0.5*0.5=0
所以新樣本更可能屬於c1類,即男生。
總結樸素貝葉斯計算過程:
(截圖摘自帶你理解樸素貝葉斯分類演算法)
條件概率,全概率,貝葉斯公式
王式安的這道題的做法,題幹 在先取出的零件是一等品的條件下,之前選箱子的概率p a 和p b 就是1 2和1 2。這裡錯誤了!正確答案選c 按照他的思想計算公式,1 3 1 1 3 0 1 3 在先選出的球是紅球的條件下,排除第三種情況各佔1 2 顯然錯誤的。錯誤原因就在於忽略了當摸出紅球的時候,他...
條件概率 全概率 貝葉斯公式
參考 ref 設a,b是兩個事件,且p b 0,則在事件b發生的條件下,事件a發生的條件概率 conditional probability 為 p a b p ab p b 分析 一般說到條件概率這一概念的時候,事件a和事件b都是同一實驗下的不同的結果集合,事件a和事件b一般是有交集的,若沒有交集...
關於條件概率,全概率公式,貝葉斯公式
今天看到關於貝葉斯公式的乙個比較全面的應用,但是在看的時候突然發現自己以前對於貝葉斯公式的記憶已經模糊,故從頭開始把概率論這些基本的公式全部重新學習一般,並記錄下來,希望能以乙個淺顯易懂的方式表達出來。下面直接進入正題。首先說條件概率,我們知道現實中一件事情的發生可能會在不同的情況下,那麼在某一種特...