貝葉斯學習及共軛先驗

2021-07-11 23:11:12 字數 1416 閱讀 5586

貝葉斯學習

首先,我從最簡單的硬幣投擲開始。現在給你乙個硬幣,假設有

θ 的概率為正面朝上,那麼有1−

θ 的概率是背面朝上,那麼如果在5次投擲過程中,有3次是正面朝上,那麼這個

θ 最可能是多少呢?

憑著頻數的直觀感覺,我們可能會認為是3/5,當然這是根據統計規律得到的結論。那麼實際上這是乙個二項分布,即重複n次的伯努利實驗。由上述所述,很容易知道其概率表示如下 p(

x=3)

=c35

θ3(1

−θ)2

我們需要這個概率盡量大,那麼最終解得的值為3/5。函式影象如下

但是,我們想象一下,如果在5次投擲過程中,5次都正面朝上,那豈不是得到的估計值是1? 很明顯這種情況得到的估計值不合理。為了避免這種「黑天鵝事件」(非常難以**,且不尋常的事件)的發生,需要將值降低一些才能看似更符合常理,那麼我們只需要乘上另乙個小於1的概率值就可以達到了。到了這裡貝葉斯公式橫空出世!如下 p(

θ|x)

=p(x

|θ)p

(θ)p

(x)

其中p(θ

) 叫做先驗概率,p(

x|θ)

叫做似然概率,先驗概率是對似然概率的一種補充,如上述的擲硬幣。而後驗概率p(

θ|x)

正比於似然概率和先驗概率的乘積。 設x

1,x2

,…,x

n 是來自總體

x 的樣本,x1

,x2,

…,xn

為其觀測值,則x1

,x2,

…,xn

的聯合概率密度函式為f(

x,θ)

=f(x

1,x2

,…,x

n,θ)

,其中θ∈

θ 是總體

x 的未知引數.

經典統計認為未知引數

θ是常數,而貝葉斯統計認為未知引數

θ 是隨機變數,這樣樣本x1

,x2,

…,xn

的聯合密度函式就是在給定

θ 下的條件密度函式,稱為思然函式,即 l(

x|θ)

=f(x

1,x2

,…,x

n,θ)

由於引數

θ 是隨機變數,因此具有分布,設π(

θ)是它的密度函式,一般π(

θ)是有引數的先驗資訊來確定,成π(

θ)是引數

θ 的先驗密度函式,則引數

θ 和樣本x1

,x2,

…,xn

的聯合密度函式即 h(

x,θ)

=l(x

|θ)π

(θ)

貝葉斯學習及共軛先驗

今天的主要任務是來理解共軛先驗以及貝葉斯學習。最近在研究主題模型,裡面用到了一些,另外在機器學習中,貝葉斯學習是重要的乙個方向,所以有必要學習和掌握。contents 1.貝葉斯學習 2.beta分布及共軛先驗 1.貝葉斯學習 首先,我從最簡單的硬幣投擲開始。現在給你乙個硬幣,假設有 面朝上,那麼如...

貝葉斯學習及共軛先驗

共軛先驗 是啥?網上找幾篇文章,收集與此!今天的主要任務是來理解共軛先驗以及貝葉斯學習。最近在研究主題模型,裡面用到了一些,另外在機器學習中,貝葉斯學習是重要的乙個方向,所以有必要學習和掌握。contents 1.共軛先驗分布 2.貝葉斯學習 3.beta分布及共軛先驗 1.共軛先驗分布 什麼又是共...

貝葉斯學習及共軛先驗

共軛先驗 是啥?網上找幾篇文章,收集與此!今天的主要任務是來理解共軛先驗以及貝葉斯學習。最近在研究主題模型,裡面用到了一些,另外在機器學習中,貝葉斯學習是重要的乙個方向,所以有必要學習和掌握。contents 1.共軛先驗分布 2.貝葉斯學習 3.beta分布及共軛先驗 1.共軛先驗分布 什麼又是共...