李航.統計學習方法中高斯混合模型僅介紹一元高斯分布的情況,周志華.機器學習則採用多元高斯分布的寫法,但求解過程不夠突出em演算法的思想。此外,李航.統計學習方法中的一些寫法會產生誤解。因此下面過程主要根據李航.統計學習方法中的推導方法,但會有部分修正。
gmm演算法主要利用em演算法來估計高斯混合模型中的引數,然後根據計算得到的
概率進行聚類。
em演算法原理看這裡
1、定義
2、目標函式
理論的目標函式:
3、步驟
(1)首先計算高斯混合模型的引數
輸入:觀測資料d= ,高斯混合模型的個數
輸出:高斯混合模型引數
4、注意
如果細心的同學可以看見,迭代更新引數中,一維和多維中方差或協差陣計算所帶入的均值有所差異(或者說是兩本書的差異)。一維高斯分布引數計算中,方差更新計算帶入的是上一步的均值,而多維高斯分布中協差陣帶入的是更新後的均值。兩者的差異不大,計算方差或協差陣時帶入上一步計算的均值或更新後的均值都可以,只要保證收斂即可。一般情況下都是收斂的。
機器學習筆記 GMM模型
1.高斯分布的一些結論 利用似然估計對一組符合高斯分布的資料進行分析,得到其均值的估計就是樣本的均值,方差的估計就是樣本方差。具體推導如下 高斯分布的概率密度函式為 對一組符合高斯分布的樣本進行似然估計,將樣本代入概率密度函式,有目標函式 轉換成對數似然 分別對均值和方差求導,可以得到 高斯混合模型...
機器學習 理論知識
一 混淆矩陣 confusion matrix 混淆矩陣也稱誤差矩陣,是表示精度評價的一種標準格式,用n行n列的矩陣形式來表示。具體評價指標有總體精度 製圖精度 使用者精度等,這些精度指標從不同的側面反映了影象分類的精度。在人工智慧中,混淆矩陣 confusion matrix 是視覺化工具,特別用...
初識機器學習 理論篇
1.什麼是機器學習?概念 利用計算機從歷史資料中找到規律,並把這些規律用到未來不確定場景的決策。場景 人來幹 資料分析 計算機來幹 機器學習 2.資料 歷史資料 3.規律 從資料中找出規律 概率論和數理統計 先抽樣 描述統計 假設檢驗 用模型刻畫 擬合 規律 維度較少時還能用,多維的不可用 4.機器...