9 主成分分析

2022-06-01 13:18:08 字數 779 閱讀 2389

一、用自己的話描述出其本身的含義:

1、特徵選擇

根據需求,選擇具有價值的樣本特徵,即減少不必要的樣本特徵。

減少特徵具有重要的現實意義,不僅減少過擬合、減少特徵數量(降維)、提高模型泛化能力,而且還可以使模型獲得更好的解釋性,增強對特徵和特徵值之間的理解,加快模型的訓練速度,一般的,還會獲得更好的效能。

2、pca

pca,也稱為主成成分分析,

是一種使用最廣泛的資料降維演算法。pca的主要思想是將n維特徵對映到k維上,這k維是全新的正交特徵也被稱為主成分,是在原有n維特徵的基礎上重新構造出來的k維特徵。pca的工作就是從原始的空間中順序地找一組相互正交的座標軸,新的座標軸的選擇與資料本身是密切相關的。其中,第乙個新座標軸選擇是原始資料中方差最大的方向,第二個新座標軸選取是與第乙個座標軸正交的平面中使得方差最大的,第三個軸是與第1,2個軸正交的平面中方差最大的。依次類推,可以得到n個這樣的座標軸。通過這種方式獲得的新的座標軸,我們發現,大部分方差都包含在前面k個座標軸中,後面的座標軸所含的方差幾乎為0。於是,我們可以忽略餘下的座標軸,只保留前面k個含有絕大部分方差的座標軸。事實上,這相當於只保留包含絕大部分方差的維度特徵,而忽略包含方差幾乎為0的特徵維度,實現對資料特徵的降維處理。

二、並用自己的話闡述出兩者的主要區別

pca是指 principal components analysis,譯為主要成分分析。用於減少資料集的維度,同時保持資料集中使方差貢獻最大的特徵。改變了原來特徵的形式。 

特徵選取是從包含多個特徵的資料集中挑選出幾個特徵作為實際使用的資料集,用於訓練模型。沒有改變特徵的形式。

9 主成分分析

一 用自己的話描述出其本身的含義 1 特徵選擇 根據實際情況需要篩選出符合模型訓練的特徵,只是從一堆特徵裡單純挑出需要的特徵,沒有對這些特徵進行過修改和降維,形成新的特徵 2 pca 主成分分析pca,他會根據特徵資料的規律和主要成分將特徵自動降維成更具代表性,更簡潔的資料,降低資料的冗餘量,使不同...

9 主成分分析

一 用自己的話描述出其本身的含義 1 特徵選擇 特徵選擇也叫特徵子集選擇。是指從已有的m個特徵 feature 中選擇n個特徵使得系統的特定指標最優化,是從原始特徵中選擇出一些最有效特徵以降低資料集維度的過程,是提高學習演算法效能的乙個重要手段,也是模式識別中關鍵的資料預處理步驟。2 pca 主成分...

9 主成分分析

一 用自己的話描述出其本身的含義 1 特徵選擇 群中選優,取其精華 去其糟粕。在得到的資料中選出特徵後,從選出的資料特徵中找到更好的資料特徵,逐步優化。例如 20個特徵選取10個,其中被選取的特徵中有資料值為10 特徵選擇應用完後 被選取的10個特徵中的資料10不會改變 2 pca 主成分分析 壓縮...