#主成分分析
pca=pca(n_components=
0.9)
data=pca.fit_transform(cross)
#降維x=data[
:500
]x.shape(
)#對類別預設為4
km=kmeans(n_clusters=4)
km.fit(x)
predict=km.predict(x)
#顯示聚類結果
plt.figure(figsize=(10
,10))
#建立顏色不同的類別列表
colored=
['orange'
,'green'
,'blue'
,'purple'
]colorl=
[colored[i]
for i in predict]
plt.scatter(x[:,
1],x[:20]
,color=colorl)
plt.x_label(
'1')
plt.x_label(
'20'
)#評估係數(輪廓係數)
#同類值與同類均值差距與最小不同類值差距的均值之比
sklearn.metrics.silhouette_score(x,predict)
1. list item
k means聚類分析
k means演算法是machine learning領域內比較常用的演算法之一。首先從n個資料物件任意選擇 k 個物件作為初始聚類中心 而對於所剩下其它物件,則根據它們與這些聚類中心的相似度 距離 分別將它們分配給與其最相似的 聚類中心所代表的 聚類 然 後再計算每個所獲新聚類的聚類中心 該聚類中...
聚類分析 K Means演算法
k means演算法 這是基於劃分的聚類演算法,該演算法效率較高,對大規模資料進行聚類時被廣泛使用。基本思路 把資料集劃分成k 個簇,每個簇內部的樣本非常相似,不同簇之間的差異非常大。k means演算法是乙個迭代演算法,先隨機選擇 k個物件,每個物件代表了起中心,對於剩下的物件,將其賦給最近的簇,...
機器學習 K means聚類分析
1.k means聚類演算法原理 1 先丟擲乙個情景問題 航空公司怎麼樣對客戶分群,區分 值客戶 無價值客戶等,對不同的客戶群體實施個性化的營銷策略,實現利潤最大化?對於該類情景題,可使用聚類分析方法。2 聚類分析相關概念 在沒有給定劃分類別的情況下,根據資料的相似度進行分組的一種方法,分組的原則是...