#!/usr/bin/env python
#-*- coding:utf-8 -*-
#接k_means.py
#k_means.py中得到三維規範化資料data_zs;
#r增加了最後一列,列索引為「聚類類別」
from sklearn.manifold import tsne
tsne=tsne()
tsne.fit_transform(data_zs) #進行資料降維,降成兩維
#a=tsne.fit_transform(data_zs) #a是乙個array,a相當於下面的tsne_embedding_
tsne=pd.dataframe(tsne.embedding_,index=data_zs.index) #轉換資料格式
import matplotlib.pyplot as plt
d=tsne[r[u'聚類類別']==0]
plt.plot(d[0],d[1],'r.')
d=tsne[r[u'聚類類別']==1]
plt.plot(d[0],d[1],'go')
d=tsne[r[u'聚類類別']==2]
plt.plot(d[0],d[1],'b*')
plt.show()
聚類 簡述高維資料聚類
concept 聚類其實就是講乙個物件的集合分為由相似物件組成的多個類的過程。聚類與分類的區別在於,聚類劃分的類是不確定的,需要自身進行相似性比較,並且確定劃分的類。一般而言,對於聚類演算法的要求還是比較高的。而對於高維資料聚類的聚類演算法主要有兩種 子空間聚類 subspace clusterin...
python 降維與資料聚類之 TSNE
計算機可以處理任意多維的資料集,但我們人類認知只侷限於3維空間,計算機依然需要我們,所以需要通過一些方法有效的視覺化高維資料。通過觀察現實世界的資料集發現其存在一些較低的本徵維度,同時,盡可能多地保持高維資料的重要特徵。在高維空間相似的資料點,對映到低維空間距離也是相似的。常規的做法是用歐式距離表示...
高維聚類結果視覺化
利用sklearn包裡的birch演算法,以iris資料集,聚類結果視覺化 如下 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets.samples generator import make blobs ...