前言:介紹了最簡單的最大似然估計 ,距離實現「樸素貝葉斯」還有一些距離。在這篇文章,我想分享一下,我所理解的「最大似然估計 - 高斯分布」。(這裡都是玩具資料,為了方便理解才列出)01
2345
6789
101112x
1234
4.24.4
4.64.856
78y0
0001
1110
000假設 x = 4.9 用科學的辦法估計 y 的分類。
高斯分布的概率密度函式
通常用「概率密度函式」代替概率,僅僅去比較大小。還有其他的分布,我也沒有去深挖 :)。而不是直接求出概率。這非常重要!!!
還記得之前我們說過的「似然函式」嗎?現在寫出這個資料的「似然函式」
p(y=0 | x) = p(y=0 | x=1)p(y=0 | x=2)p(y=0 | x=3)p(y=0 | x=4)p(y=0 | x=5)p(y=0 | x=6)p(y=0 | x=7)p(y=0 | x=8)
p(y=1 | x) = p(y=1 | x=4.2)p(y=0 | x=4.4)p(y=0 | x=4.6)p(y=0 | x=4.8)
似然函式的本質描述出現這個情形的概率,最大化它即是是這個情形出現的概率最大。現在遇到了乙個問題,我們無法寫出等式左邊的每一項。就更別談最大化似然函式了。
常用的方法用概率密度函式替代概率。
比如:把 x = 1 帶入概率密度函式代替 p(y=0 | x=1)。
所以最大化多個概率相乘變為了,最大化多個概率密度函式的相乘
取對數求導,並讓導數為 0 。最後能得到乙個非常舒適的結論。
最大化似然函式
現在求得兩組 (mu, sigma), (mu, sigma) 用來分別表示。
y = 1 時,最符合資料的概率密度函式 1
y = 0 時,最符合資料的概率密度函式 2
將 x = 4.9 分別帶入函式 1、函式 2 中比較大小,最後確定 y 的類別。
最大似然估計,高斯分布,高斯混合模型,EM演算法
1 最大似然估計 似然的概念與概率類似,但是又很不相同。假如隨機變數x服從某種分布 比如高斯分布 概率是指在給定引數 均值,方差 的條件下,x x的可能性 而似然則指x x的條件下,某一組引數反映了x x的真實性大小。最常見的應用是最大似然估計。假設有n個資料點,服從某種分布pr x 我們想找到一組...
最大似然估計 極大似然估計
目錄最大似然估計 個人部落格 對於最大似然估計我們使用最簡單的拋硬幣問題來進行講解當我們拋一枚硬幣的時候,就可以去猜測拋硬幣的各種情況的可能性,這個可能性就稱為概率一枚質地均勻的硬幣,在不考慮其他情況下是符合二項分布的,即正面和翻面的概率都是0.5,那麼我們拋10次硬幣5次正面在上面的概率為 但是現...
最大似然估計
利用已知的樣本結果,反推最有可能 最大概率 導致這樣結果的引數值 例如 乙個麻袋裡有白球與黑球,但是我不知道它們之間的比例,那我就有放回的抽取10次,結果我發現我抽到了8次黑球2次白球,我要求最有可能的黑白球之間的比例時,就採取最大似然估計法 我假設我抽到黑球的概率為p,那得出8次黑球2次白球這個結...