1.這個是非監督學習演算法。大致的演算法過程如下:
選擇要分成的類別的個數:這個可以使用「肘部演算法」(距離損失之和和選擇聚類個數的曲線圖,在有特別彎折的地方就是,要選取的聚類的個數,但是很多情況下這個並沒有特別明顯的彎折), 所以很多時候要根據具體的需要來進行確定要聚類的種類數。
選取好了聚類的個數,就隨機初始化聚類的點,然後計算各個點到所有聚類中心點的距離,選取乙個距離最近的中心點,作為它歸屬的類,所有的點都有乙個當時比較合理的分類之後,再將劃分好a類裡面的所有點(除聚類中心點以外)求乙個中心的平均位置,將之前隨機初始化的點移動到那個中心位置,所有的聚類中心點移動完成之後,再重複之前的過程,重新找屬於那個聚類中心點點的集合,一次次的重複迭代,然後直到找到最合適的分類為止
2.優缺點
這個去csdn之類的地方一查就可以了,有很多的解析
3.kmeans演算法的用途
用於聚類;用於影象壓縮(但是一般實際的影象壓縮不使用它)
K Means聚類演算法
k means聚類演算法 intergret kmeans演算法的基本思想是初始隨機給定k個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然後按平均法重新計算各個簇的質心,從而確定新的簇心。一直迭代,直到簇心的移動距離小於某個給定的值。k means聚類演算法主要分為三個步驟 1 第一步是為待聚類...
聚類演算法 K means
演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得乙個 中心物件 引力中心 來進行計算的。k means演算法是最為經典的基於劃分的聚類方法,是十大經典資料探勘演...
k means聚類演算法
說到聚類,得跟分類區別開來,分類是按人為給定的標準將樣本歸到某個類別中去,在機器學習中多是監督學習,也就是訓練樣本要給標籤 正確的類別資訊 而聚類是在某種規則下自動將樣本歸類,在機器學習中是無監督學習,不需要提前給樣本打標籤。k means聚類演算法,就是在某種度量方式下,將樣本自動劃分到k個類別中...