貝葉斯學派和頻率學派的一點感悟

2021-06-26 13:37:39 字數 1050 閱讀 7742

引言:我這人看書有個毛病,喜歡刨根問底,有人覺得是好事啊,這樣明明白白做人;但有時候也未必,原因在於你沒有足夠的時間去深究。那麼,這次我為什麼會思考貝葉斯和頻率學派這個問題呢?

首先**於自己正在讀研,搞過資料探勘的朋友應該都聽過經典的prml

(patterrn recogniztion and machine learning

),其中看到第一章時候有句話叫「」包括從後面作者對一些概念的陳述無時不刻地告訴我們:老子我是信貝葉斯的,要看我這本書先同意貝葉斯學派

!可能之前從沒有什麼疑問,這大概就是因為無知的時候無知,過了無知的線後更加無知。於是我就翻回去看貝葉斯的公式:

實際上在學習概率統計的時候我也有過這樣的疑問,這個公式為什麼長這樣?似乎教科書上只有一些證明,沒有告訴我們really why.

於是我希望藉此機會好好弄明白這個問題。

回顧一下,我們從小學到中學最初接觸到的概率模型是怎麼樣的?

「現在需要估計魚塘裡的魚,老王撈了20

隻後都標記了重新放入水塘,再次撈了

100只起來發現有

5只身上有標記,請估計魚塘裡魚的數量。」

很顯然,這是利用了抽樣調查的統計方法去估計,這個思維也貫穿了我們早起的概率印象:基於真是資料來推出客觀事實。其中,魚塘可以看成乙個隨機過程的容器,為這些帶標記的魚奠定了它們成為隨機變數的基礎。

然而,生活和實際應用中我們很多時候是沒辦法做抽樣調查的,比如飛彈……

忽然有點明白:

最大似然法:

這篇博文舉得例子循序漸進,很有思考意義。實際上如果僅僅用「是否加入了主觀推測」這個來判斷貝葉斯和頻率派是不嚴密的,因為頻率學派在假定乙個模型的時候本身就加入了基於經驗和主觀的思考!回過頭來看看這篇博文的例子,傳統方法中,我們是先假定乙個模型再去預估各種情況出現的概率;而日常生活中我們常常會有一些先驗的知識和觀測值,那麼我們就會想怎麼將這些東西引入帶概率統計中呢?p(data|theta)

這種方式是告訴我們在某種概率模型下,取到的資料集

data

概率為多大,顯然概率越大代表越可能是這種模型。

除了一些博文,豆瓣上的乙個討論組讓我看到了很多不一樣思維的觀點。

頻率學派和貝葉斯學派 引數估計

頻率學派往往通過證據推導一件事情發生的概率,而貝葉斯學派還會同時考慮這個證據的可信度。從引數估計的角度來講,頻率學派認為引數是固定不變的,雖然我們不知道它,但是我們可以根據一組抽樣值去 它的結果,這就有了極大似然估計 mle 極大似然估計的思想就是,我已經抽樣產生了一組值 例如拋硬幣5次,得出結果 ...

統計學中的頻率學派與貝葉斯學派

對於技術應用人員來說,我們更看重方法的應用,但有時候對知識的背景做一些了解,我覺得還是挺有必要的,能幫助我們理解一些東西。這篇博文裡,不會呈現任何計算公式,只是討論一下貝葉斯學派與頻率學派之間的問題。貝葉斯學派與頻率學派是當今數理統計學的兩大學派,基於各自的理論,在諸多領域中都起到了重要作用。自20...

貝葉斯和頻率的哲思

貝葉斯學派的論點 頻率學派 貝葉斯學派 theta是乙個定值theta是乙個分布 樣本是隨機的,因此研究樣本的分布認為theta是隨機的,因而研究引數的分布 x1,x2 n theta,100 生成過程 在plsa中,我們假定文件是這樣生成的 你不停的重複扔 文件 主題 骰子和 主題 詞項 骰子 重...