pca主要是定義乙個x對映到z,且只能在訓練集裡使用pca
當定義完之後,就可以進行交叉驗證和測試集裡使用
主要功能:
減少儲存資料需要的空間
加速學習的演算法
錯誤1使用pca減少資料維度去解決過擬合
應該使用正則化,利用線性回歸等去處理
因為pca會損失一些維度資訊,可能會漏掉重要資訊
而正則化的y值是已知的
錯誤2不要一開始就使用pca
很多時候直接用原始資料也能完成專案
如果一開始就花大量時間想怎麼使用pca怎麼計算k值會浪費大量時間,得不償失。
資料降維PCA 學習筆記
pca降維。基於方差降維,屬於無監督學習。無需資料標籤。使方差 資料離散量 最大,變換後資料分開。更易於分類。可以對隱私資料pca,資料加密。基變換投影 內積 正交的基,兩個向量垂直 內積為0,線性無關 先將基化成各維度下的單位向量。一般把資料寫成列向量的形式,新的基寫成矩陣的形式。基 向量 基要在...
PCA演算法筆記
此博文只是自己的學習筆記,不具參考價值 pca演算法將高維特徵轉換成低維特徵 非線性相關 同時減小計算量。將原始資料按列組成m mm行n nn列矩陣x xx m mm個屬性,n nn個樣本 將x xx的每一行 代表乙個屬性字段 進行零均值化,即減去這一行的均值,得到x x x 求出協方差矩陣c cc...
PCA主成分分析學習筆記
dl書上這一節公式很多,相關的符號有點不習慣,借鑑相關部落格 主要是協方差計算和pca具體原理和python實現部分的講解 希望研究例項能更好幫助大家理解公式和計算過程的具體意義 基礎知識回顧 首先是會看到一些熟悉的公式 均值 方差 以下假設我們有二維資料 借用網上常用的資料好驗證結果正確性 第一步...