機器學習 特徵降維

2022-09-11 19:30:22 字數 339 閱讀 4634

機器學習中的資料維度與真實世界的維度本同末離。機器學習中,通常需要將現實世界中的資料進行轉化,形成計算機能夠處理的資料向量的形式,而往往為了學習到較好的模型,需要的資料向量維度都是非常大的。從而導致了學習乙個模型或者演算法往往需要大量的資源的消耗,有時甚至產生維度災難的問題。因此, 為了緩解這一問題,又能夠保留大部分特徵的貢獻學習到較好的模型,資料特徵降維,即使用乙個較低維的資料向量表達高位資料向量能夠表達的大部分資訊,顯得尤為重要。

常見的特徵降維方法有:

主成分分析

線性判別分析

等距對映

區域性線性嵌入

拉普拉斯特徵對映

區域性保留投影

等...

20191201 機器學習複習 特徵降維

降維 降低維度 維數 巢狀的維數 降維是二維陣列 降低特徵的個數 正是因為進行訓練的時候,我們都是使用特徵學習。如果特徵學習本身存在問題或者特徵之間關聯性比較強,對於演算法學習 會影響很大 降維的方法 特徵選擇 主成分分析 特徵選擇 資料中包含冗餘或相關變數 或稱特徵,屬性,指標 旨在從原有特徵中找...

機器學習 特徵選擇及降維

資料中包含冗餘或無關變數 或稱特徵 屬性 指標等 旨在從原有特徵中找出主要特徵 演算法自動選擇特徵 特徵與目標值之間的關聯 決策樹 資訊熵 資訊增益 正則化 l1 l2 深度學習 卷積等 sklearn.feature selection刪除低方差的一些特徵,前面講過方差的意義。再結合方差的大小來考...

(sklearn)機器學習(六)特徵降維

ndarray 維數 0維 標量 1維 向量 2維 矩陣 對二維陣列降維 此處的降維 降低特徵的個數降維的兩種方法 特徵選擇 filter過濾式 方差選擇法 低方差特徵過濾 相關係數 特徵與特徵之間的相關程度 embedded 嵌入式 決策樹正則化 深度學習 主成分分析低方差特徵過濾 特徵方差小 某...