獲取聚類結果中每一類的資料,該資料型別是dataframe
思路:獲取clf_kmeans的標籤,我這裡是聚三類,標籤就是0,1,2
將label轉成series型別,再篩選出指定標籤的res0,我篩選了1
最後在dataframe裡獲取label為1的資料
import pandas as pdfrom sklearn.cluster import kmeans
# 建立模型。n_clusters引數用來設定分類個數,即k值,這裡表示將樣本分為兩類。
clf_kmeans = kmeans(n_clusters=3, max_iter=10
) # 模型訓練。得到**值。
"clf_kmeans聚類中心\n
", (clf_kmeans.cluster_centers_)
quantity =pd.series(clf_kmeans.labels_).value_counts()
"cluster2聚類數量\n
", (quantity)
#獲取聚類之後每個聚類中心的資料
res0series =pd.series(clf_kmeans.labels_)
res0 = res0series[res0series.values == 1
"類別為1的資料\n
",(df.iloc[res0.index])
另外一種方法,更簡潔
res = dataframe[(clf_kmeans.labels_ == 1)]
python 實現kmeans聚類
程式設計中在做數值相等判斷的時候,直接使用 判斷並不可靠。實際上經過運算後的兩個值 浮點型 並不可能完全一致,可能會因為小數點後的些許差異導致判斷為false。比如 1 print1e 5 1e 6 這肯定是false,但是實際這兩個值可以看作近似相等。在kmeans中判斷是否結束迴圈,就是判斷重新...
Kmeans聚類演算法 python實現
kmeans演算法 k均值演算法需要輸入待聚類的資料和欲聚類的簇數k,主要過程如下 1.隨機生成k個初始點作為質心 2.將資料集中的資料按照距離質心的遠近分到各個簇中 3.將各個簇中的資料求平均值,作為新的質心,重複上一步,直到所有的簇不再改變 import pandas as pd import ...
Python資料建模 K means聚類
k means聚類的python實現方法 介紹 最常用的機器學習聚類演算法,且為典型的基於距離的聚類演算法 k均值 基於原型的 劃分的距離技術,它試圖發現使用者指定個數 k 的簇,以歐式距離作為相似度測度 from sklearn.datasets.samples generator import ...