機器學習(7)K mean聚類

2021-08-13 11:22:16 字數 557 閱讀 9883

聚類屬於非監督學習,k-mean是聚類中經典演算法。非監督學習即是只有樣本沒有標籤。

訓練資料集(其中x(i)∈rnx(i)∈rn)和聚類數量kk(將資料劃分為kk類);演算法輸出是kk個聚類中心μ1,μ2,…,μkμ1,μ2,…,μk和每個資料點x(i)x(i)所在的分類。

步驟:1,初始化k個聚類中心μ1,μ2,…,μkμ1,μ2,…,μk;

2,對於每個資料點x(i)x(i),尋找離它最近的聚類中心,將其歸入該類;即c(i)=mink||x(i)−μk||2c(i)=mink||x(i)−μk||2,其中c(i)c(i)表示x(i)x(i)所在的類;

3,更新聚類中心uk的值為所有屬於類kk的資料點的平均值;

代價函式:

u是簇c的均值向量,上式計算樣本與均值向量之間的距離。

python例子:

sklearn機器學習 聚類演算法K Means

n init k均值演算法將在不同質心種子下執行的次數。就慣性而言,最終結果將是n init個連續執行的最佳輸出。max iter 單次執行的k均值演算法的最大迭代次數。tol 預設 1e 4,關於frobenius範數的相對容差,該範數表示兩個連續迭代的聚類中心的差異,以宣告收斂。precompu...

機器學習之K Mean聚類演算法

知識點 coding utf 8 import numpy as np import pandas as pd from sklearn.cluster import kmeans 非監督學習 聚類演算法 1 隨機再資料當中抽取三個樣本,當作三個類別的中心點 k1,k2,k3 2 計算其餘的點分別到...

K mean聚類演算法

k mean演算法屬於非監督類演算法,模型相對簡單。目標函式 j sum dj i 演算法 1 初始化k個點 2 樣本xi,到k個點的距離為 dk xi uk j argmin j dk xi屬於cj 3 更新引數 uk sum xi i sum i 重複2和3,終止條件j的變化很小或者uk變化很小...