import matplotlib.pyplot as plt
#載入matplotlib用於資料的視覺化
from sklearn.decomposition import pca
#載入pca演算法包
from sklearn.datasets import load_iris
#載入鳶尾花資料
data = load_iris(
)#以字典形式載入資料
y=data.target#使用y表示資料集中的標籤
x=data.data#使用x表示資料集的屬性資料
pca=pca(n_components=2)
#載入pca演算法,設定降維後的維度為2
reduced_x=pca.fit_transform(x)
#對原始資料進行降維,儲存在reduced_x中
red_x,red_y=
,blue_x,blue_y=
,green_x,green_y=
,#三類資料點
#按照鳶尾花的類別進行降維處理
for i in
range
(len
(reduced_x)):
if y[i]==0
:[0]
)[1]
)elif y[i]==1
:[0]
)[1]
)else:[
0])[
1])#對降維後的資料視覺化
資料降維 PCA 基於鳶尾花資料集
主成分分析pca 主成分分析 principal component analysis,pca 主成分 可以把具有相關性的高緯度變數,合成為線性無關的低緯度變數,稱為主成分。主成分能夠盡可能保留原始資料的資訊。原理 矩陣的主成分就是其協方差矩陣對應的特徵向量,按照對應的特徵值大小進行排序,最大的特徵...
用PCA對鳶尾花資料集降維並視覺化
上篇部落格中,我們介紹了並用 實現了pca演算法,本篇部落格我們應用pca演算法對鳶尾花資料集降維,並視覺化。鳶尾花資料集簡介 實現 來自mooc網的 python機器學習應用 課程。import matplotlib.pyplot as plt from sklearn.decomposition...
利用KNN對鳶尾花資料進行分類
knn k nearest neighbor 工作原理 存在乙個樣本資料集合,也稱為訓練樣本集,並且樣本集中每個資料都存在標籤,即我們知道樣本集中每一資料與所屬分類對應的關係。輸入沒有標籤的資料後,將新資料中的每個特徵與樣本集中資料對應的特徵進行比較,提取出樣本集中特徵最相似資料 最近鄰 的分類標籤...