機器學習 K means

這個演算法主要是乙個迭代的過程

1.在乙個資料集中隨機選擇k個聚類中心

2.按照離各個聚類中心的遠近來將資料集中的資料劃分到各個分類中。

3.將各個分類中資料點的平均座標來作為新的聚類中心

一直重複2、3過程直到各個分類中的資料點的平均座標正好等於聚類中心的座標為止。

k-means演算法也有可能會出現區域性最優的情況，比如

上邊三幅圖的資料點是一樣的，但是由於聚類中心的初始化的不同，導致最後的分類結果也是不同的。其實k-means演算法也可以理解成是有損失函式的。這個損失函式就是各個資料點到其所在分類的聚類中心的距離。因此我們可以隨機初始化多次聚類中心，進行多次k-means演算法，得到多個損失函式，我們選擇損失函式最小的聚類中心的初始化方式即可避免出現區域性最優的情況。

機器學習 K means

機器學習 kmeans

機器學習 K means實踐

機器學習（二十） K means

機器學習 K means

機器學習 kmeans

機器學習 K means實踐

機器學習（二十） K means

相關推薦