要了解貝葉斯定理,我們必須先知道什麼是條件概率
概率是什麼我們大家都知道,它能夠反映隨機事件出現的可能性大小
那什麼是條件概率,
現在有一位小明同學,上學總是遲到,遲到也是有概率的,
小明每次遲到當然也是有原因的,假設小明遲到就是因為晚上打遊戲早上經常睡過,
如果前一天小明不玩遊戲,第二天遲到的概率是20%
如果小明前一天玩遊戲,那第二天遲到的概率是60%
這兩個也就稱之為條件概率,有條件的遲到
那到底這和貝葉斯有什麼關係呢
貝葉斯就是首先知道乙個概率,叫做先驗概率,然後呢再收集一些資訊,這些資訊呢就是上面說的那些條件概率,通過貝葉斯定理就可以計算出乙個後驗的概率,這麼說比較抽象,還是這個例子具體來講
我們現在知道了小明玩遊戲遲到的概率,那我們想翻過來推,小明第2天遲到了,他前一天玩遊戲的概率是多少,這個就是我們想要通過貝葉斯定理來計算的後驗概率
上述的兩個條件概率就是我們收集到的資訊,這還不夠,要想知道後驗概率(小明第2天遲到了,他前一天玩遊戲的概率),我們還需要知道一些先驗資訊,那就是小明晚上玩遊戲的概率,
接的假設小明晚上不玩遊戲的概率是30%,玩遊戲的概率是70%
其實看的很複雜一共也就四種情況
情況結果的概率
值玩遊戲遲到
70%*60%
0.42
玩遊戲不遲到
70%(1-60%)
0.28
不玩遊戲遲到
30%*20%
0.06
不玩遊戲不遲到
30%(1-20%)
0.24
0.42+0.28+0.06+0.24=1
所以得到小明遲到前一天玩遊戲的概率是0.42/(0.42+0.06)*100%=87.5%
當然了,這也只是兩事件情形的貝葉斯定理
貝葉斯定理還可能是有很多的情形,如下面的公式
貝葉斯還有乙個例子
愛滋病患病率為萬分之一,誤診率為5%,患有愛滋病者被診斷出來的概率為99%,請問在這樣的設定下如果有乙個人被診斷為愛滋病陽性,那麼這個人患愛滋病的概率是多少
根據公式,不難算出
99%×1/10000/(99%×1/10000+5%×9999/10000)≈0.198%
看起來似乎不可思議,其實問題就出在了這個5%的誤診上面,5%的誤診,10000個人誤診就是500人,而這500人中也只要乙個患病的,大概就是千分之2的概率
那麼想要提高準確率,直接把誤診率縮小到和患病率一樣,1/10000那麼如下
99%×1/10000/(99%×1/10000+1/10000×9999/10000)≈49.8%
要讓診斷結果的可靠性超過百分之五十,它的誤診率需要低於萬分之一才行
也就是誤診率和患病率相同的情況下,可靠性才能接近百分之五十
主要原因還是患病率極低所導致
如果是正常的病,患病率是10%,那麼即使誤診率在5%,可靠性是69%
99%×1/10/(99%×1/10+5%×9/10)≈69%
貝葉斯定理
貝葉斯定理是關於隨機事件a和b的條件概率 或邊緣概率 的一則定理。其中p a b 是在b發生的情況下a發生的可能性。貝葉斯定理也稱貝葉斯推理,早在18世紀,英國學者貝葉斯 1702 1763 曾提出計算條件概率的公式用來解決如下一類問題 假設h 1 h 2 h n 互斥且構成乙個完全事件,已知它們的...
貝葉斯定理
貝葉斯定理是關於隨機事件a和b的條件概率 或邊緣概率 的一則定理。p a 是 a 的先驗概率,之所以稱為 先驗 是因為它不考慮任何 b 方面的因素。p a b 是已知 b 發生後 a 的條件概率,也由於得自 b 的取值而被稱作 a 的後驗概率。p b a 是已知 a 發生後 b 的條件概率,也由於得...
Bayes Rule 貝葉斯定理
貝葉斯定理是關於隨機事件a和b的 條件概率 或 邊緣概率 的一則定理。其中p a b 是在b發生的情況下a發生的可能性。在貝葉斯定理中,每個名詞都有約定俗成的名稱 按這些術語,bayes定理可表述為 後驗概率 相似度 先驗概率 標準化常量 也就是說,後驗概率與先驗概率和相似度的乘積成正比。另外,比例...