(學習這部分內容約需要1.9小時)
在貝葉斯框架中, 我們將統計模型的引數視為隨機變數. 模型由變數值的先驗分布以及決定引數如何影響觀測資料的證據模型來指定. 當我們對觀測資料進行條件化時, 我們得到引數的後驗分布. 術語"貝葉斯引數估計"會讓我們誤以為對引數進行了估計, 實際上我們通常可以完全跳過引數估計步驟. 我們把引數積分掉, 並直接進行**.
弄清楚這個概念需要一些預備知識:
(閱讀/**以下資源之一)
計算認知小抄(computational cognition cheat sheets, 2013)
簡介: 一組為認知科學家寫的筆記
csc321的課程筆記, 神經網路導論(intro to neural nets, 2015)
簡介: 多倫多大學本科神經網路課程講義
資源: lecture "learning probabilistic models," pages 7-17
講義**
[**]
(以下為選修內容, 但你可能會發現它們很有用)
貝葉斯資料分析(bayesian data analysis)
簡介: 貝葉斯統計教科書, 著重於實際問題
位置: sections 2.1-2.3, pgs. 33-39
[**]
pattern recognition and machine learning(prml)
研究生機器學習課程的教科書, 聚焦於貝葉斯方法
位置: section 2.1, pgs. 68-74
[**]
返回貝葉斯學習路線圖
頻率學派和貝葉斯學派 引數估計
頻率學派往往通過證據推導一件事情發生的概率,而貝葉斯學派還會同時考慮這個證據的可信度。從引數估計的角度來講,頻率學派認為引數是固定不變的,雖然我們不知道它,但是我們可以根據一組抽樣值去 它的結果,這就有了極大似然估計 mle 極大似然估計的思想就是,我已經抽樣產生了一組值 例如拋硬幣5次,得出結果 ...
貝葉斯估計
其實這是我之前最想第一篇來寫的隨筆了,今天就先把這一部分寫一寫吧。1.問題 乙個醫療診斷問題有兩個可選的假設 病人有癌症 病人無癌症可用資料來自化驗結果 陰性和陽性。有先驗知識 在所有人口中,患病率是0.008,對確實有病的患者的化驗準確率為98 對確實無病的患者的化驗準確率為97 問題 假定有乙個...
機器學習 引數估計 貝葉斯(已知解析式求引數)
必要性 已知概率密度函式形式,用樣本來估計引數。最大似然估計 1.理論 現在已經拿到了很多個樣本,那麼我們要找乙個引數,使這些樣本發生的可能性最大。這些樣本已經產生了,所以找到的這個引數應當最有利於這些樣本的產生。2.似然函式 實質就是概率函式,含有引數而樣本點已經帶入的函式。詳情見下面。3.特殊的...