from sklearn.manifold import tsne
tsne = tsne(
)tsne.fit_transform(data_zs)
#進行資料降維
tsne = pd.dataframe(tsne.embedding_, index = data_zs.index)
#轉換資料格式
import matplotlib.pyplot as plt
plt.rcparams[
'font.sans-serif']=
['simhei'
]#用來正常顯示中文標籤
plt.rcparams[
'axes.unicode_minus']=
false
#用來正常顯示負號
#不同類別用不同顏色和樣式繪圖
d = tsne[r[u'聚類類別']==
0]plt.plot(d[0]
, d[1]
,'r.'
)d = tsne[r[u'聚類類別']==
1]plt.plot(d[0]
, d[1]
,'go'
)d = tsne[r[u'聚類類別']==
2]plt.plot(d[0]
, d[1]
,'b*'
)plt.show(
)
Python 資料視覺化
資料視覺化指的是通過視覺化表示來探索資料,它與資料探勘緊緊相關,而資料探勘指的是使用 來探索資料集的規律和關聯。資料集可以是用一行 就能表示的小型數字列表,也可以是數以吉位元組的資料。漂亮地呈現資料關乎的並非僅僅是漂亮的。以引人注目的簡潔方式呈現資料,讓人能夠明白其含義,發現資料集中原本未意識到的規...
python 視覺化庫
在做titanic分析的過程中,看了一些大神的想法,發現在分析資料的過程中,許多大神會使用到seaborn,plotly這些庫,而我等小白僅僅知道matplotlib這個唯一的資料視覺化庫而已。上網查詢資料後整理如下 資料視覺化庫可以根據其應用場景來分為以下幾類 基礎的2d,3d圖繪製庫,互動資訊視...
tSNE 高維資料降維視覺化(理論部分)
t sne是一種降維方法,pca主成分分析 lda等屬於線性降維,t sne屬於非線性降維,是一種流形學習方法 manifold learning 如圖所示的曲面上,兩點之間的歐式距離為紅色虛線所示,藍色實線為兩點之間的測地線距離,第二張圖為knn圖,展開後如第三張圖所示。兩點之間的最短距離為藍色實...