PCA學習總結

2021-07-28 07:07:47 字數 637 閱讀 6719

一. 定義

pca即主成分分析法,是一種常用的資料分析方法。pca通過線性變換將原始資料變換成一組各維度線性無關的表示,可用於提取資料的主要特徵分量,常用於高維資料的降維。

二. pca數學原理

下面的部落格上介紹的很清楚。覺得寫的很棒

三. pca演算法

設有m條n維資料

1)將原始資料按列組成n行m列矩陣x

2)將x的每一行(代表乙個屬性字段)進行零均值化,即減去這一行的均值。

3)求出協方差矩陣

4)求出協方差矩陣對應的特徵值和特徵向量

5)將特徵向量按對應的特徵值大小從上到下按行排列成 矩陣,取前k行組成矩陣p

6)y=px 即為降維到k維後的資料

四. 總結

pca的本質是將方差最大的方向作為主特徵,並且在各個正交方向上將資料「離」相關,也就是讓他們在不能正交方向上沒有相關性。

pca是一種無引數技術,便於通用實現,無法進行個性化的優化。

五. 矩陣相關知識

矩陣是乙個表示二維空間的陣列,矩陣可以看做是乙個變換。

下面的部落格上介紹的很清晰。

機器學習 PCA

介紹 pca是一種無監督學習的降維技術 思想1.投影後樣本越分散,保留的資訊越多 2.pca的主要思想是將n維特徵對映到k維上,這k維是全新的正交特徵也被稱為主成分,是在原有n維特徵的基礎上重新構造出來的k維特徵 做法1.將所有的樣本點向直線w投影 2.目標函式 讓投影後樣本的方差極大 第一步 x減...

PCA學習筆記

pca主要是定義乙個x對映到z,且只能在訓練集裡使用pca 當定義完之後,就可以進行交叉驗證和測試集裡使用 主要功能 減少儲存資料需要的空間 加速學習的演算法 錯誤1使用pca減少資料維度去解決過擬合 應該使用正則化,利用線性回歸等去處理 因為pca會損失一些維度資訊,可能會漏掉重要資訊 而正則化的...

關於PCA的總結

最近學習了主成份分析 principal component analysis 這個經典方法。學習的材料是a tutorial on principal component analysis by jonathon shlens 學習完之後,感覺這篇材料關於pca寫得非常簡潔明瞭,也很適合自學。現在...