應用PCA的建議

2021-09-17 21:12:02 字數 707 閱讀 9179

pca運用在監督學習演算法下,可以對資料x降維,從而加速學習演算法的速度。

如下所示,我們的訓練集x是10000維向量,我們可以通過pca將其降維成z是1000維的向量,此時訓練集從(x,y)變成(z,y)。每次輸入x都通過pca的對映變成z,然後再帶入到假設函式中計算。

除了加速學習演算法的速度,pca還可以減少記憶體的需求。

當然,有時也會發生一些不好的運用pca的例子。

比如我們不應該利用pca來避免過擬合,雖然這樣做可能有時候會有點改進,但是我們還是會保留99%的方差。所以我們應該用更加實用的正則化來避免過擬合。

還有就是我們在設計乙個機器學習系統時,我們有時列舉的專案計畫一開始就包括了運用pca來降維,但是這是不可取的做法,我們應該首先考慮的是,不使用pca的情況下,整個系統會得到什麼結果,而不是一開始就花費大量時間去運用pca降訓練集降維。

PCA方法的應用場景

pca principal component analysis pca 是主成分分析方法,是一種較為粗糙的降維方法,對於小樣本量的資料來說,它不如因子分析方法實用。但是當資料量較大時,主成分分析方法就有了用武之地了。pca方法常用於人臉識別。當樣本資料成千上萬時,維數上千時,pca是非常有效的一種...

PCA 應用,簡單的電影推薦

這篇部落格主要介紹 pca演算法的應用 ratings.dat 場次 和 movies.dat 第二步 pandas 讀取資料 第三步 建立乙個m u 的rating 矩陣,m 是電影,u是使用者。user1 id user2 id movie1 id20 movie2 id21 movie2 id...

opencv自帶的PCA降維應用(一)

好啦,下面進入正題 首先在降維之前我提取的vlad特徵是60 64維的,即3840維,我的庫有5063張,所以降維前我的庫的vlad特徵是5063 3840,我們給他取個名,叫vlad all,是5063行,3840列哦,行和列不要弄混了,我想把3840維的特徵降為128維,也就是減少30倍,最終使...