夏一夜百家號
17-09-10
22:54
眾所周知,貝葉斯定理是一種在已知其他概率的情況下求概率的方法:
那我們怎麼去理解這個傳說中不黃但很暴力的貝葉斯定理呢,貝葉斯定理是如何暴力狂虐數學界的?
首先,對於貝葉斯定理,還是要先了解各個概率所對應的事件。
p(a|b) 是在 b 發生的情況下 a 發生的概率;
p(a) 是 a 發生的概率;
p(b|a) 是在 a 發生的情況下 b 發生的概率;
p(b) 是 b 發生的概率。
還沒看懂。。。那我還是舉個栗子吧
京西大旅館為了慶祝開業三周年的好日子,老闆劉強西準備帶著實習生小天去郊外旅遊,不過一大早天空多雲:
糟了!50%的雨天的早上是多雲的!
但多雲的早上其實挺多的(大約40%的日子早上是多雲的)!
這個月乾旱為主(平均30天裡一般只有3天會下雨,10%)!
劉強西45°角仰望天空,想著要不要去郊遊。。。
作為聰明的實習生,小天立馬拿出他的小本子:
此時,我們用"雨"來代表今天下雨,"雲"來代表早上多雲。
當早上多雲時,當天會下雨的可能性是 p(雨|雲)。
p(雨|雲) = p(雨)·p(雲|雨) /p(雲)
p(雨) 是今天下雨的概率 = 10%
p(雲|雨) 是在下雨天早上有云的概率 = 50%
p(雲) 早上多雲的概率 = 40%
基本的概率情況已經確定,那就簡單了
p(雨|雲) =0.1×0.5/0.4=0.125
小天:劉老闆,不用看天氣了,今天下午的概率只有12.5%,可以去郊遊的。
劉強西聽完後:行,那趕緊上車!
然而,「小天」算不如天算,你看,天就下雨了。。。
小天尷尬ing
故事到這裡還沒結束,超模君當時在學習貝葉斯定理的時候,時常會記不住到底是b在前,還是a在前,公式該怎麼寫。
直到有一次,小天(這個小天是超模君的小天,不是劉強西的小天)看我在寫貝葉斯公式,說出:ab ab ab。
所以對於貝葉斯公式,記住ab ab ab,然後再做分組:"ab = a×ba/b"。
別急,假如「a」還有兩個可能
各位模友,你們聽說「假陽性」、「假陰性」這兩個詞嗎?
是的,沒錯,就是某些疾病檢測一般喜歡用名詞,醫學院的同學趕緊拿好小板凳,接下來就是考試重點了。
貝葉斯定理雖然只是乙個概率計算公式,但其最著名的乙個用途便是「假陽性」和「假陰性」檢測。
再丟個栗子。。。
上次沒出成郊遊,劉強西卻在路邊撿了乙隻小流浪貓回京西大旅館,每天就顧著擼貓。。。
兩天過後,劉強西突然渾身發癢,小天就想起來是不是劉強西對貓過敏,於是劉強西就做了乙個簡單的過敏檢測:
對於真的有這種過敏的人,檢測有 80% 的機會給回 "有" 的結果;
對於沒有這種過敏的人,檢測有 10% 的機會給回 "有" 的結果(而這種情況,稱之為"假陽性")。
從實際情況看,京西大旅館的村子有 1% 的人有這種過敏,而劉強西的檢測結果是 "有",那麼劉強西真的有這種過敏的可能性有多大?
p(過敏) 是有這種過敏的概率 = 1%
p(有|過敏) 是對於真的有這種過敏的人,檢測的結果是 "有" = 80%
p(有) 是對於任何人,檢測的結果是 "有" = ??%
糟糕!我們並不知道檢測結果是 "有" 的一般可能性是多少……
不過我們可以把有這種過敏和沒有這種過敏的概率相加來求這個一般概率:
1% 的人有這種過敏,檢測對 80% 的這些人說 "有"
99% 的人沒有這種過敏,檢測對 10% 的這些人說 "有"
把概率加起來:
p(有) = 1% × 80% + 99% × 10% = 10.7%
就是說大約 10.7% 的人會得到 "有" 的檢測結果。
那此時我們就可以計算出,劉強西真正對貓過敏的概率為
p(過敏|有) = 1% × 80%/10.7%= 7.48%
所以此時也就有了貝葉斯定理特別版:
最後說多兩句:
貝葉斯統計作為常用的基礎演算法,不要小看其作用,其在機器學習中是佔據重要的一席之地。尤其是在資料處理方面,針對事件發生的概率以及事件可信度分析上具有良好的分類效果。
用於精準判斷的貝葉斯定理
說起貝葉斯定理,不得不說條件概率,所謂 條件概率 conditional probability 指在事件b發生的情況下,事件a發生的概率,用p a b 來表示。條件概率計算公式為p a b p ab p b 條件概率公式是乙個定義公式,或者說是公理化的,不好證明和推導。只能通過邏輯來理解了,ab都...
機器學習筆記之貝葉斯定理的通俗理解
樸素貝葉斯是一種基於貝葉斯定理的簡單概率分類器 分類又被稱為監督式學習,所謂監督式學習即從已知樣本資料中的特徵資訊去推測可能出現的輸出以完成分類,反之聚類問題被稱為非監督式學習 樸素貝葉斯在處理文字資料時可以得到較好的分類結果,所以它被廣泛應用於文字分類 垃圾郵件過濾 自然語言處理等場景。了解貝葉斯...
穿看完後的總結
穿終於看完了,看完之後的乙個感覺就是 啊,終於解放了!因為感覺看的時候真得是特別的痛苦,尤其是到了60 80集的時候。我為什麼說看得特別累呢,因為它的例子吧,都是已經寫好 的,看著 講,例子說大也不大,說學到東西也能學到東西,但是弄起來特別麻煩,所以會有這種感覺。在 穿的前20 30多集左右吧,是在...