gmm中隱變數是什麼的 通俗理解GMM

2021-10-12 21:16:01 字數 719 閱讀 8151

多個高斯分布的加權求和(pi表示每個分量的權重)叫做高斯混合模型(gmm),可以表示比單一高斯分布更複雜的分布。

每乙個樣本可以表示為

假設用極大似然求解,外層的p(x)相乘之後取log可以變成相加,但是裡層的log(加權求和)無法處理

當定義了one-hot的隱變數z,表示只取出了mixture中的某乙個高斯分布時,單獨乙個高斯分布p(x|z)處理起來就很容易了(當然處理很多個也很容易,迴圈一下完事)。

完全資料集合 無法獲取,但是潛變數 的後驗概率分布 ( | , )可以進行估計
這句話的通俗解釋是:我們沒法知道每個樣本x是來自哪個分量z,但是可以知道這個樣本處於每個分量的概率是多少

e-step最大化樣本的期望

為什麼theta在後面?因為theta是已知的

為什麼我們可以知道p(z|x,theta)?後驗概率,求選擇每個分量的概率

為什麼可以知道p(x,z|theta)?每個分量的簡單分布(比如單高斯分布)

m-step尋找使q函式最大的引數值

具體到gmm

e-step求後驗概率

m-step更新引數

其中nk表示這個高斯產生了多少個樣本,之後就可以更新權重pi

XML是什麼的通俗理解

1 xml 指可擴充套件標記語言 extensible markup language 什麼是標記語言 這裡和文字語言對比,什麼是文字語言,比如記事本,裡面寫什麼就怎麼展示,比如寫乙個 臥槽 那麼你在任何地方開啟都只能看到乙個 臥槽 而且,所有地方,大小,方向,粗細都一致。那麼標記語言,先理解什麼是...

通俗理解鴨子型別是幹什麼的

定義大家都看過了,我說點容易理解的,我預設大家都是學過c語言的。還記得c語言怎麼定義變數的不。int x x 1 float y y 1.1 char z z hello 對吧,編譯器知道你定義的x是int型,y是float型,z是char型,因為你告訴它了。所以當你給變數x賦值x hello 時,...

C 中左值和右值是什麼以及存在的理解誤區

左值 lvalue 和右值 rvalue 的通俗理解是在如下的等式中,右值 right value 放在等號右邊,左值 left value 放在等號左邊,這就是左值右值的初步定義。int a 1 1但這種方式並不能解釋左值和右值的根本含義,並且並不是每乙個等式的左邊一定是左值,右邊一定是右值。其根...