K means聚類分析

2021-10-10 09:36:42 字數 729 閱讀 9528

#主成分分析

pca=pca(n_components=

0.9)

data=pca.fit_transform(cross)

#降維x=data[

:500

]x.shape(

)#對類別預設為4

km=kmeans(n_clusters=4)

km.fit(x)

predict=km.predict(x)

#顯示聚類結果

plt.figure(figsize=(10

,10))

#建立顏色不同的類別列表

colored=

['orange'

,'green'

,'blue'

,'purple'

]colorl=

[colored[i]

for i in predict]

plt.scatter(x[:,

1],x[:20]

,color=colorl)

plt.x_label(

'1')

plt.x_label(

'20'

)#評估係數(輪廓係數)

#同類值與同類均值差距與最小不同類值差距的均值之比

sklearn.metrics.silhouette_score(x,predict)

1. list item

k means聚類分析

k means演算法是machine learning領域內比較常用的演算法之一。首先從n個資料物件任意選擇 k 個物件作為初始聚類中心 而對於所剩下其它物件,則根據它們與這些聚類中心的相似度 距離 分別將它們分配給與其最相似的 聚類中心所代表的 聚類 然 後再計算每個所獲新聚類的聚類中心 該聚類中...

聚類分析 K Means演算法

k means演算法 這是基於劃分的聚類演算法,該演算法效率較高,對大規模資料進行聚類時被廣泛使用。基本思路 把資料集劃分成k 個簇,每個簇內部的樣本非常相似,不同簇之間的差異非常大。k means演算法是乙個迭代演算法,先隨機選擇 k個物件,每個物件代表了起中心,對於剩下的物件,將其賦給最近的簇,...

機器學習 K means聚類分析

1.k means聚類演算法原理 1 先丟擲乙個情景問題 航空公司怎麼樣對客戶分群,區分 值客戶 無價值客戶等,對不同的客戶群體實施個性化的營銷策略,實現利潤最大化?對於該類情景題,可使用聚類分析方法。2 聚類分析相關概念 在沒有給定劃分類別的情況下,根據資料的相似度進行分組的一種方法,分組的原則是...