k means聚類後按標籤大小順序排列標籤

2021-10-18 22:56:29 字數 1085 閱讀 6600

為上面的學生分數,聚類成優、良、中、差、四類

主要是聚類後,怎麼把標籤對應到原始資料中去,這裡我們採用掩碼的方式

from sklearn.cluster import kmeans

import pandas as pd

data=pd.read_csv(

"kmeanstest.csv"

,sep=

",")

print

(data)

x =data[

"score"

].to_numpy(

).reshape(-1

,1)kmeans = kmeans(n_clusters=

4, random_state=0)

.fit(x)

y=kmeans.labels_

print

(y)kc=kmeans.cluster_centers_

print

(kc)

kc_list=

sorted

([i for i in kc[:,

0]])

print

(kc_list)

data[

"cluster_center"

]=kc[y]

defmy

(x):

if x==kc_list[0]

:return

"差"elif x==kc_list[1]

:return

"中"elif x==kc_list[2]

:return

"良"else

:return

"優"data[

K Means聚類演算法

k means聚類演算法 intergret kmeans演算法的基本思想是初始隨機給定k個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然後按平均法重新計算各個簇的質心,從而確定新的簇心。一直迭代,直到簇心的移動距離小於某個給定的值。k means聚類演算法主要分為三個步驟 1 第一步是為待聚類...

聚類演算法 K means

演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得乙個 中心物件 引力中心 來進行計算的。k means演算法是最為經典的基於劃分的聚類方法,是十大經典資料探勘演...

模糊kmeans聚類

首先介紹乙個,fuzzykmeans演算法的主要思想 模糊均值聚類 fcm 即眾所周知的模糊isodata,是用隸屬度確定每個資料點屬於某個聚類的程度的一種聚類演算法。1973年,bezdek提出了該演算法,作為早期硬均值聚類 hcm 方法的一種改進。fcm把 n 個向量 xi i 1,2,n 分為...