頻率學派認為世界是確定的,有乙個本體,這個本體的真值是不變的,我們的目標就是要找到這個真值或真值所在的範圍。
頻率學派:存在唯一真值θ。當資料量趨於無窮時,這種方法能給出精準的估計;然而缺乏資料時則可能產生嚴重的偏差。
貝葉斯學派認為世界是不確定的,人們對世界先有乙個預判,而後通過觀測資料對這個預判做調整,我們的目標是要找到最優的描述這個世界的概率分布。
貝葉斯學派: θ是乙個隨機變數,符合一定的概率分布。在貝葉斯學派裡有兩大輸入和一大輸出,輸入是先驗 (prior)和似然 (likelihood),輸出是後驗 (posterior)。
先驗,即p(θ),指的是在沒有觀測到任何資料時對θ的預先判斷,似然,即p(x|θ),是假設θ已知後我們觀察到的資料應該是什麼樣子的;後驗,即p(θ|x),是最終的引數分布。
隨著資料量的增加,引數分布會越來越向資料靠攏,先驗的影響力會越來越小
機器學習筆記 1 頻率派和貝葉斯派
頻率派認為當我們有一堆資料時,這些資料一定是符合乙個規律的,只是這個規律我們並不知道,這裡的規律可以理解為構造這些資料所需要的引數,這些引數是唯一確定的,我們的目標是如何從已經給到的資料中去估計出這些引數,而我們估計的引數可以使得這些資料發生的概率是最大的。其中 最大似然估計 幹的就是這麼件事。貝葉...
機器學習白板系列(概率派和貝葉斯派)
x data,x為n個,每個樣本都是p維向量 每乙個x p x p x theta p x theta parameter p x p x theta p x 中的 theta 是乙個常量,對於n個觀測的樣本點的概率為 為了求 theta 的大小,我們採用最大對數似然估計mle p x p x th...
貝葉斯和頻率的哲思
貝葉斯學派的論點 頻率學派 貝葉斯學派 theta是乙個定值theta是乙個分布 樣本是隨機的,因此研究樣本的分布認為theta是隨機的,因而研究引數的分布 x1,x2 n theta,100 生成過程 在plsa中,我們假定文件是這樣生成的 你不停的重複扔 文件 主題 骰子和 主題 詞項 骰子 重...