貝葉斯定理

2022-03-15 20:17:35 字數 1784 閱讀 3119

貝葉斯定理是關於隨機事件a和b的條件概率(或邊緣概率)的一則定理。其中p(a|b)是在b發生的情況下a發生的可能性。

貝葉斯定理也稱貝葉斯推理,早在18世紀,英國學者貝葉斯(1702~1763)曾提出計算條件概率的公式用來解決如下一類問題:假設h[1],h[2]…,h[n]互斥且構成乙個完全事件,已知它們的概率p(h[i]),i=1,2,…,n,現觀察到某事件a與h[1],h[2]…,h[n]相伴隨機出現,且已知條件概率p(a|h[i]),求p(h[i]|a)。

貝葉斯定理在檢測吸毒者時很有用。假設乙個常規的檢測結果的敏感度與可靠度均為99%,也就是說,當被檢者吸毒時,每次檢測呈陽性(+)的概率為99%。而被檢者不吸毒時,每次檢測呈陰性(-)的概率為99%。從檢測結果的概率來看,檢測結果是比較準確的,但是貝葉斯定理卻可以揭示乙個潛在的問題。假設某公司將對其全體雇員進行一次鴉片吸食情況的檢測,已知0.5%的雇員吸毒。我們想知道,每位醫學檢測呈陽性的雇員吸毒的概率有多高?令「d」為雇員吸毒事件,「n」為雇員不吸毒事件,「+」為檢測呈陽性事件。可得

p(d|+) = p(+|d)p(d)/(p(+|d)p(d)+p(+|n)p(n))=0.99 *0.005/0.0149=0.332215   即  (吸毒者陽性檢出率x雇員吸毒概率) /陽性檢出率

儘管我們的檢測結果可靠性很高,但是只能得出如下結論:如果某人檢測呈陽性,那麼此人是吸毒的概率只有大 約33%,也就是說此人不吸毒的可能性比較大。我們測試的條件(本例中指d,雇員吸毒)越難發生,發生誤判的可能性越大。

但如果讓此人再次複檢(相當於p(d)=33.2215%,為吸毒者概率,替換了原先的0.5%),再使用貝葉斯定理計算,將會得到此人吸毒的概率為98.01%。但這還不是貝葉斯定理最強的地方,如果讓此人再次複檢,再重複使用貝葉斯定理計算,會得到此人吸毒的概率為99.98%(99.9794951%)已經超過了檢測的可靠度。

假設有兩個各裝了100個球的箱子,甲箱子中有70個紅球,30個綠球,乙箱子中有30個紅球,70個綠球。假設隨機選擇其中乙個箱子,從中拿出乙個球記下球色再放回原箱子,如此重複12次,記錄得到8次紅球,4次綠球。問題來了,你認為被選擇的箱子是甲箱子的概率有多大?

用python解決一下:(注意**不要格式化了)

def

bayesfunc(pisbox1, pbox1, pbox2):

return (pisbox1 * pbox1) / ((pisbox1 * pbox1) + (1 - pisbox1) *pbox2)

defredgreenballproblem():

#甲事件的先驗概率

pisbox1 = 0.5

#consider 8 red ball

for i in range(1, 9):

pisbox1 = bayesfunc(pisbox1, 0.7, 0.3)

print("

after red %d > in 甲 box: %f

" %(i, pisbox1))

#consider 4 green ball

for i in range(1, 5):

pisbox1 = bayesfunc(pisbox1, 0.3, 0.7)

print("

after green %d > in 甲 box: %f

" %(i, pisbox1))

redgreenballproblem()

結果:

表示概率是:96.7%

貝葉斯定理

要了解貝葉斯定理,我們必須先知道什麼是條件概率 概率是什麼我們大家都知道,它能夠反映隨機事件出現的可能性大小 那什麼是條件概率,現在有一位小明同學,上學總是遲到,遲到也是有概率的,小明每次遲到當然也是有原因的,假設小明遲到就是因為晚上打遊戲早上經常睡過,如果前一天小明不玩遊戲,第二天遲到的概率是20...

貝葉斯定理

貝葉斯定理是關於隨機事件a和b的條件概率 或邊緣概率 的一則定理。p a 是 a 的先驗概率,之所以稱為 先驗 是因為它不考慮任何 b 方面的因素。p a b 是已知 b 發生後 a 的條件概率,也由於得自 b 的取值而被稱作 a 的後驗概率。p b a 是已知 a 發生後 b 的條件概率,也由於得...

Bayes Rule 貝葉斯定理

貝葉斯定理是關於隨機事件a和b的 條件概率 或 邊緣概率 的一則定理。其中p a b 是在b發生的情況下a發生的可能性。在貝葉斯定理中,每個名詞都有約定俗成的名稱 按這些術語,bayes定理可表述為 後驗概率 相似度 先驗概率 標準化常量 也就是說,後驗概率與先驗概率和相似度的乘積成正比。另外,比例...