K means演算法的學習筆記

2021-09-26 13:33:44 字數 452 閱讀 5237

感謝吳教授的講述~

今天在學習k-means演算法~

首先我們需要了解並且確定的是:

在k-means演算法中,隨著迭代次數的增多,損傷函式的值會不斷下降,而不會出現公升高的情況。

也就是說,如果我們繪製出當前k-means方法的損失函式的曲線,而發現出現在某次迭代時,出現損失函式值上公升的情況,那麼肯定是**實現出現了問題,

這也是 machine learning課程中k-means章節的一道思考題,

可以看到,圖中j(θ

)j(\theta)

j(θ)

的曲線出現了波動的情況,而根據理論來說,這是不可能的,(具體的數學推導還需要進一步學習),所以其中的原因肯定是**實現出現了問題。

學習筆記 K means演算法

在資料探勘中,k means演算法是一種cluster analysis的演算法,其主要是來計算資料聚集的演算法,主要通過不斷地取離種子點最近均值的演算法。問題k means演算法主要解決的問題如下圖所示。我們可以看到,在圖的左邊有一些點,我們用肉眼可以看出來有四個點群,但是我們怎麼通過電腦程式找出...

學習筆記 K means 演算法

學習k means 演算法前,需要先學習k means演算法,可以參考這篇部落格看得懂的k means 既然了解了k means演算法,那麼我們來對比下k means 有什麼變化。首先k means最大的問題就是對初始點選擇特別敏感,那麼我們就乙個乙個選,而不是k個一起選。步驟與k means類似 ...

學習筆記 K means演算法

我們先來看一下乙個k means的聚類效果圖 隨機設定k個特徵空間內的點作為初始的聚類中心 對於其他每個點計算到k個中心的距離,未知的點選擇最近的乙個聚類中心點作為標記類別 接著對著標記的聚類中心之後,重新計算出每個聚類的新中心點 平均值 如果計算得出的新中心點與原中心點一樣,那麼結束,否則重新進行...