資料降維及壓縮

2021-09-25 03:18:00 字數 921 閱讀 2945

《python3資料分析與機器學習實戰》閱讀筆記》.

資料降維

資料降維,也稱維數約簡(dimensionality reduction),即降低資料的維數,將原始高維特徵空間中的點向乙個低維空間投影,新的空間維度低於原始特徵空間,所以維數減少了。在這個過程中,特徵發生了根本性的變化,原始的特徵消失了(雖然新的特徵也保持了原特徵的一些性質)。

特徵選擇

特徵選擇指的是從資料樣本集的所有特徵(或稱屬性)中選擇更有利於達到某種目標的若干屬性,即原始屬性集的乙個子集,

同時也達到了降低維度的目的;

由於特徵選擇並不改變其原有屬性,所以結果只是乙個原始屬性的優化特徵子集,保留了原屬性的物理意義,方便使用者理解;

特徵變換

特徵變換則是指通過某種變換將原始輸入空間的屬性對映到乙個新的特徵空間,然後在特徵空間中根據規則選擇某些較為重要的變換後的特徵。

而特徵變換的結果失去了原始特徵的物理意義,但能夠提取其隱含的特徵資訊,移除原特徵集屬性之間的相關性與冗餘性。

小結

而特徵變換的結果失去了原始特徵的物理意義,但能夠提取其隱含的特徵資訊,移除原特徵集屬性之間的相關性與冗餘性。

資料降維的方法

截至目前,資料降維的方法很多,從不同的角度有不同的分類。

很多時候,需要根據特定問題選用合適的資料降維方法。

python降維分析 Python資料降維

一些資料降維的特徵提取演算法,先導入包和資料 import numpy as np import pandas as pd import matplotlib.pyplot as plt from mpl toolkits.mplot3d import axes3d from sklearn.dec...

資料降維方法

資料降維基本原理是將樣本點從輸入空間通過線性或非線性變換對映到乙個低維空間,從而獲得乙個關於原資料集緊致的低維表示。資料降維工具箱drtoolbox中眾多演算法,這裡簡單做個分類。因為很多並沒有仔細了解,在此次只對八種方法做分類 主成分分析 principal component analysis,...

資料降維 PCA

模型原型 class sklearn.decomposition.pca n components none,copy true,whiten false 引數 copy 如果為false,則直接使用原始資料來訓練,結果會覆蓋原始資料所在的陣列 whiten 如果為true,則會將特徵向量除以n s...