PCA主成分分析

2021-09-29 13:53:04 字數 662 閱讀 4147

1. 高斯分布:就是正態分佈

1.主成分:將樣本作圖,資料變化劇烈程度最大的方向就是主成分所在的方向。就是說,資料在某個方向上的投影上的方差最大,那麼這個方向就是主成分的方向。

2.通過特徵值和特徵向量來求主成分,對資料做相應的變化(比如在將資料沿某軸縮放,然後旋轉),然後計算樣本協方差矩陣,求這個協方差矩陣的特徵值和特徵向量,特徵值最大的就對應最主要的主成分,其對應的特徵向量就是樣本投影的方向。

第三張圖中的橢圓的長軸方向就是最大的特徵值對應的特徵向量的方向

1.資料預處理:

在降維之前,需要對資料進行預處理,最常見的方法就是,將資料減去均值再除以標準差,這樣子可以避免不同維度之間的資料差距過大帶來的不良影響。

2.降維步驟:

3.降維後的資料處理

公式中的

資料中心的白化

pca主成分分析 PCA主成分分析(中)

矩陣 matrix,很容易讓人們想到那部著名的科幻電影 駭客帝國 事實上,我們又何嘗不是真的生活在matrix中。機器學習處理的大多數資料,都是以 矩陣 形式儲存的。矩陣是向量的組合,而乙個向量代表一組資料,資料又是多維度的。比如每個人的都具有身高 體重 長相 性情等多個維度的資訊資料,而這些多維度...

主成分分析PCA

主要參考這篇文章 個人總結 pca是一種對取樣資料提取主要成分,從而達到降維的目的。相比於上篇文章介紹到的svd降維不同,svd降維是指減少資料的儲存空間,資料的實際資訊沒有缺少。個人感覺pca更類似與svd的去噪的過程。pca求解過程中,涉及到了svd的使用。針對資料集d 假設di 的維度為 w ...

PCA 主成分分析

在進行影象的特徵提取的過程中,提取的特徵維數太多經常會導致特徵匹配時過於複雜,消耗系統資源,不得不採用特徵降維的方法。所謂特徵降維,即採用乙個低緯度的特徵來表示高緯度。將高緯度的特徵經過某個函式對映至低緯度作為新的特徵。pca和lda區別 pca是從特徵的角度協方差角度 求出協方差矩陣的特徵值和特徵...