Python學習 TSNE視覺化

2021-10-23 15:53:25 字數 711 閱讀 4765

from sklearn.manifold import tsne

tsne = tsne(

)tsne.fit_transform(data_zs)

#進行資料降維

tsne = pd.dataframe(tsne.embedding_, index = data_zs.index)

#轉換資料格式

import matplotlib.pyplot as plt

plt.rcparams[

'font.sans-serif']=

['simhei'

]#用來正常顯示中文標籤

plt.rcparams[

'axes.unicode_minus']=

false

#用來正常顯示負號

#不同類別用不同顏色和樣式繪圖

d = tsne[r[u'聚類類別']==

0]plt.plot(d[0]

, d[1]

,'r.'

)d = tsne[r[u'聚類類別']==

1]plt.plot(d[0]

, d[1]

,'go'

)d = tsne[r[u'聚類類別']==

2]plt.plot(d[0]

, d[1]

,'b*'

)plt.show(

)

Python 資料視覺化

資料視覺化指的是通過視覺化表示來探索資料,它與資料探勘緊緊相關,而資料探勘指的是使用 來探索資料集的規律和關聯。資料集可以是用一行 就能表示的小型數字列表,也可以是數以吉位元組的資料。漂亮地呈現資料關乎的並非僅僅是漂亮的。以引人注目的簡潔方式呈現資料,讓人能夠明白其含義,發現資料集中原本未意識到的規...

python 視覺化庫

在做titanic分析的過程中,看了一些大神的想法,發現在分析資料的過程中,許多大神會使用到seaborn,plotly這些庫,而我等小白僅僅知道matplotlib這個唯一的資料視覺化庫而已。上網查詢資料後整理如下 資料視覺化庫可以根據其應用場景來分為以下幾類 基礎的2d,3d圖繪製庫,互動資訊視...

tSNE 高維資料降維視覺化(理論部分)

t sne是一種降維方法,pca主成分分析 lda等屬於線性降維,t sne屬於非線性降維,是一種流形學習方法 manifold learning 如圖所示的曲面上,兩點之間的歐式距離為紅色虛線所示,藍色實線為兩點之間的測地線距離,第二張圖為knn圖,展開後如第三張圖所示。兩點之間的最短距離為藍色實...