主成分分析(PCA)

2021-10-07 22:12:25 字數 771 閱讀 2953

主成分分析(principal components analysis,pca)是一種統計分析、簡化資料集的方法,它利用正交變換來對一系列可能相關的變數的觀測值進行線性變換,從而投影為一系列線性不相關變數的值,這些不相關變數稱為主成分(principal components)。具體地,主成分可以看做乙個線性方程,其包含一系列線性係數來指示投影方向。pca對原始資料的正則化或預處理敏感(相對縮放).

基本思想:

將座標軸中心移到資料的中心,然後旋轉座標軸,使得資料在c1軸上的方差最大,即全部n個資料個體在該方向上的投影最為分散。意味著更多的資訊被保留下來。c1成為第一主成分

c2第二主成分以此類推,找到第三主成分,第四主成分。。。。第p個主成分。p個隨機變數可以有p個主成分。

主成分分析經常用於減少資料集的維數,同時保留資料集當中對方差貢獻最大的特徵。這是通過保留低維主成分,忽略高維主成分做到的。這樣低維成分往往能夠保留住資料的最重要部分。但是,這也不是一定的,要視具體應用而定。由於主成分分析依賴所給資料,所以資料的準確性對分析結果影響很大。

(.......待續)

pca主成分分析 PCA主成分分析(中)

矩陣 matrix,很容易讓人們想到那部著名的科幻電影 駭客帝國 事實上,我們又何嘗不是真的生活在matrix中。機器學習處理的大多數資料,都是以 矩陣 形式儲存的。矩陣是向量的組合,而乙個向量代表一組資料,資料又是多維度的。比如每個人的都具有身高 體重 長相 性情等多個維度的資訊資料,而這些多維度...

主成分分析PCA

主要參考這篇文章 個人總結 pca是一種對取樣資料提取主要成分,從而達到降維的目的。相比於上篇文章介紹到的svd降維不同,svd降維是指減少資料的儲存空間,資料的實際資訊沒有缺少。個人感覺pca更類似與svd的去噪的過程。pca求解過程中,涉及到了svd的使用。針對資料集d 假設di 的維度為 w ...

PCA 主成分分析

在進行影象的特徵提取的過程中,提取的特徵維數太多經常會導致特徵匹配時過於複雜,消耗系統資源,不得不採用特徵降維的方法。所謂特徵降維,即採用乙個低緯度的特徵來表示高緯度。將高緯度的特徵經過某個函式對映至低緯度作為新的特徵。pca和lda區別 pca是從特徵的角度協方差角度 求出協方差矩陣的特徵值和特徵...