一、用自己的話描述出其本身的含義:
1、特徵選擇
群中選優,取其精華、
去其糟粕。
在得到的資料中選出特徵後,從選出的資料特徵中找到更好的資料特徵,逐步優化。
例如:20個特徵選取10個,其中被選取的特徵中有資料值為10→特徵選擇應用完後→被選取的10個特徵中的資料10不會改變
2、pca(主成分分析)
壓縮資料,將高維資料對映到低維空間裡面
從雜亂無章的高層世界去看投射在低層世界的投影,發現很多投影是相通的,重複的,然後用這些投影去解釋高層的世界的東西
提煉精華,以精蓋全
本質:是一種分析 、簡化資料集的技術
例如:200個特徵選取100個,其中被選取的特徵中有資料值為10→pca應用完後→被選取的100個特徵,之前的資料10可能會變成5
二、並用自己的話闡述出兩者的主要區別
9 主成分分析
一 用自己的話描述出其本身的含義 1 特徵選擇 根據實際情況需要篩選出符合模型訓練的特徵,只是從一堆特徵裡單純挑出需要的特徵,沒有對這些特徵進行過修改和降維,形成新的特徵 2 pca 主成分分析pca,他會根據特徵資料的規律和主要成分將特徵自動降維成更具代表性,更簡潔的資料,降低資料的冗餘量,使不同...
9 主成分分析
一 用自己的話描述出其本身的含義 1 特徵選擇 根據需求,選擇具有價值的樣本特徵,即減少不必要的樣本特徵。減少特徵具有重要的現實意義,不僅減少過擬合 減少特徵數量 降維 提高模型泛化能力,而且還可以使模型獲得更好的解釋性,增強對特徵和特徵值之間的理解,加快模型的訓練速度,一般的,還會獲得更好的效能。...
9 主成分分析
一 用自己的話描述出其本身的含義 1 特徵選擇 特徵選擇也叫特徵子集選擇。是指從已有的m個特徵 feature 中選擇n個特徵使得系統的特定指標最優化,是從原始特徵中選擇出一些最有效特徵以降低資料集維度的過程,是提高學習演算法效能的乙個重要手段,也是模式識別中關鍵的資料預處理步驟。2 pca 主成分...