貝葉斯公式的直觀理解(先驗概率/後驗概率)
前言
以前在許學習貝葉斯方法的時候一直不得要領,什麼先驗概率,什麼後驗概率,完全是跟想象脫節的東西,今天在聽喜馬拉雅的音訊的時候突然領悟到,貝葉斯老人家當時想到這麼一種理論前提可能也是基於一種人的直覺.
先驗概率:是指根據以往經驗和分析得到的概率.[1]意思是說我們人有乙個常識,比如骰子,我們都知道概率是1/6,而且無數次重複實驗也表明是這個數,這是一種我們人的常識,也是我們在不知道任何情況下必然會說出的乙個值.而所謂的先驗概率是我們人在未知條件下對事件發生可能性猜測的數學表示!*
後驗概率:事情已經發生,要求這件事情發生的原因是由某個因素引起的可能性的大小[1]舉個栗子首先我想問乙個問題,桌子上如果有一塊肉喝一瓶醋,你如果吃了一塊肉,然後你覺得是酸的,那你覺得肉裡加了醋的概率有多大?你說:80%可能性加了醋.ok,你已經進行了一次後驗概率的猜測.沒錯,就這麼簡單.
形式化:
我們設a為加了醋的概率,b為吃了之後是酸的概率.c為肉變質的概率
思考思考再思考
那麼先驗概率在這個公式中有沒有出現呢?有,p(a)就是一種先驗概率.
那麼什麼是p(b|a)呢? 類條件概率.
那麼p(b|a)為什麼叫類條件概率呢?馬上解釋.
在寫這個隨筆之時,我腦子中又有一種構想,所謂的後驗概率,是一種果因概率,即在乙個結果已經發生的條件下,可能是其中某乙個原因造成的概率有多大.這裡引用一段"概率論與數理統計"[2]中關於貝葉斯公式的解釋:
"如果我們把事件a看做'結果',把諸事件b1,b2...看做導致這個結果的可能的'原因',則可以形象地把全概率公式看做成為'由原因推結果';而貝葉斯公式則恰好相反,其作用於'由結果推原因':現在有乙個'結果'a以發生,在眾多可能的'原因'中,到底是哪乙個導致了這結果",這也佐證了我構想的正確性
那麼這個p(原因1導致結果)和p(結果|原因1)之間到底有什麼聯絡呢?讓我們舉乙個影象識別的例子
再舉個栗子
假如給你一些,這些中有的圖上有動物的角,這些佔了1/10(即先驗概率),且已知在有角的條件下是犀牛的概率是0.8(類條件概率1,注意這個概率互補的概率是有角條件下不是犀牛的概率),已知在無角條件下是犀牛概率的是0.05(類條件概率2),現在拿起一張圖,發現是一張犀牛的圖,那麼這張圖上帶角的概率有多大(求後驗概率)
由圖中公式可知p(上由動物的角|是犀牛) = 0.8*0.1/(0.8*0.1+0.05*0.9)=0.64
可以看到p(上由動物的角且是犀牛)=0.08與p(是犀牛|上由動物的角)=0.8之間差別非常大.
再通過比較可以發現,分母中的類條件概率實際上把乙個完整的問題集合s通過特徵進行了劃分,劃分成s1/s2/s3...,拿我剛剛提出的所謂果因概率來討論,類條件概率中的類指的是把造成結果的所有原因一(yi) 一(yi)進行列舉,分別討論.
總結:
"概率論只不過是把常識用數學公式表達了出來"---拉普拉斯我想之所以貝葉斯方法在機器學習中如此重要,就是因為人們希望機械人能像人那樣思考,而很多問題是需要計算機在已知條件下做出最佳決策的決策,而貝葉斯公式就是對人腦在已知條件下做出直覺判斷的一種數學表示.
參考文獻:
[2].概率論與數理統計 --陳希孺
先驗概率,後驗概率
一 先驗概率 1.1 定義 直觀理解,所謂 先 就是在事情之前,即在事情發生之前事情發生的概率。是根據以往經驗和分析得到的概率。1.2 例子 比如拋硬幣,我們都認為正面朝上的概率是0.5,這就是一種先驗概率,在拋硬幣前,我們只有常識。這個時候事情還沒發生,我們進行概率判斷。所謂的先驗概率是對事情發生...
先驗概率and後驗概率
from and 先驗概率 事件發生前的預判概率。可以是基於歷史資料的統計,可以由背景常識得出,也可以是人的主觀觀點給出。一般都是單獨事件概率,如p x p y 後驗概率 事件發生後求的反向條件概率 或者說,基於先驗概率求得的反向條件概率。概率形式與條件概率相同。條件概率 乙個事件發生後另乙個事件發...
先驗概率,後驗概率
對於統計學只是皮毛認識,在學校時根本不重視,如今機器學習幾乎以統計學為基礎發展起來的,頭疼的緊,如今還得琢磨基礎概念。1 我自己的理解 1 先驗 統計歷史上的經驗而知當下發生的概率 2 後驗 當下由因及果的概率 2 網上有個例子說的透徹 1 先驗 根據若干年的統計 經驗 或者氣候 常識 某地方下雨的...