資料降維 PCA 基於鳶尾花資料集

2021-08-07 14:49:24 字數 1030 閱讀 6453

主成分分析pca

主成分分析(principal component analysis, pca)

主成分:

可以把具有相關性的高緯度變數,合成為線性無關的低緯度變數,稱為主成分。主成分能夠盡可能保留原始資料的資訊。

原理:矩陣的主成分就是其協方差矩陣對應的特徵向量,按照對應的特徵值大小進行排序,

最大的特徵值就是第一主成分,其次第二主成分,以此類推。

sklearn庫,使用sklearn.decomposition.pca載入pca進行降維,主要引數:

鳶尾花資料集

from sklearn import datasets iris datasets.load iris iris是乙個字典集keys iris.keys dict keys data target target names descr feature names data iris.data.sh...

用PCA對鳶尾花資料集降維並視覺化

上篇部落格中,我們介紹了並用 實現了pca演算法,本篇部落格我們應用pca演算法對鳶尾花資料集降維,並視覺化。鳶尾花資料集簡介 實現 來自mooc網的 python機器學習應用 課程。import matplotlib.pyplot as plt from sklearn.decomposition...

鳶尾花 Iris 資料集

2.pandas庫基礎操作 3.資料視覺化 tf.keras.utils.get file fname,origin,cache dir 引數 說明fname origin 檔案的url位址 cache dir train url train path tf.keras.utils.get file...