有限混合模型在應用於資料時非常有用,其中觀察來自不同的群體,並且群體隸屬關係未知。
首先,我們將模擬一些資料。讓我們模擬兩個正態分佈 - 乙個平均值為0,另乙個平均值為50,兩者的標準差為5。
m1
m2 sd1
n1 n2
a b
現在讓我們將資料「混合」在一起......
引數怎麼樣?
cat('pred:', c1[1], '\n')
cat('true:', m1, '\n\n')
cat('pred:', c1[2], '\n')
cat('true:', sd1, '\n\n')
cat('pred:', c2[1], '\n')
cat('true:', m2, '\n\n')
cat('pred:', c2[2], '\n')
cat('true:', sd2, '\n\n')
## pred: -0.5613484
## true: 0
## ## pred: 4.799484
## true: 5
## ## pred: 52.86911
## true: 50
## ## pred: 6.89413
## true: 5
讓我們視覺化真實資料和我們擬合的混合模型。
看起來我們做得很好!
現在,讓我們考慮乙個花瓣寬度為鳶尾花的真實例子。
即使我們不知道潛在的物種分配,我們也能夠對花瓣寬度的基本分布做出某些陳述 。
拓端tecdat R語言使用混合模型進行聚類
混合模型是k個分量分布的混合,它們共同形成混合分布 f x f x f x k 1 f x f x k 1k kfk x 讓我們通過乙個例子激發您為何使用混合模型的原因。讓我們說有人向您展示了以下密度圖 我們可以立即看到所得到的分布似乎是雙峰的 即有兩個凸起 表明這些資料可能來自兩個不同的 head...
拓端tecdat R語言旅行推銷員問題TSP
常用術語中的旅行推銷員問題 tsp 是最複雜的問題之一,歸結為組合優化。旅行到n個城市 頂點 需要檢查 n 1 可能性。3,000個地點有4 10 9131個可能的解決方案。以下 輸入您的tsp225.csv檔案並輸出您的解決方案和視覺化。生成的 tour 物件是一類tour和整數 它包含您的解決方...
拓端tecdat R語言最優化問題中的共軛函式
在回歸模型研究中,我們將討論優化,而經典工具就是所謂的共軛。給定函式f rp r,其共軛值為函式f rp r使得 視覺化考慮乙個簡單的拋物線函式 在維度1中 f x x 2 2,然後f 2 是線x 2x與函式f x 之間的最大距離。f function x x 2 2 fstar function ...