基於ldfa的無監督資料降維
受ltsa啟發,本文提出一種基於深度學習框架的無監督降維演算法
related work:
1.深度學習方法: 有監督的學習方法
:cnn (卷積神經網路)
無監督的學習方法
:aes (自動編碼器)
2.區域性保持 :流形學習的特點(由三個框架可知)
不同的流形學習演算法有不同的區域性保持策略
每一種流形學習演算法(lle、ltsa、lpp、le、pca、t-sne等)都可以認為是乙個單層非線性神經網路。這樣的神經網路不能從原始資料中獲取深層次的特徵。為了實現基於這些流形方法的深層學習,本文就把流形學習演算法的區域性保持特性和深度學習演算法結合起來了。
我們想要的自動編碼器:
可以很好的重構出輸入資料
對輸入資料一定程度下的擾動具有不變性(魯棒性好)
資料的特徵選擇與降維
雜訊 部分特徵對 結果有負影響 特徵選擇就是單純地從提取到的所有特徵中選擇部分特徵作為訓練集特徵,特徵在選擇前和選擇後可以改變值 也可以不改變值,但是選擇後的特徵維數肯定比選擇前小,畢竟我們只選擇了其中的一部分特徵 輸出 2,0 1,4 1,1 1 from sklearn.feature sele...
機器學習 特徵工程 資料降維
定義 將原始資料轉換為更好地代表 模型的潛在問題的特徵的過程,從而提高了對未知資料的 準確性。內容 主要有三部分 1 特徵抽取 2 特徵預處理 3 資料的降維 機器學習領域中所謂的降維就是指採用某種對映方法,將原高維空間中的資料點對映到低維度的空間中。降維的本質是學習乙個對映函式 f x y,其中x...
常見的特徵降維方法
主成成分分析 pca 線性判別分析 linear discriminant analysis,lda 對映後類內方差最小,類間方差最大 區域性線性嵌入 locally linear embedding,lle isomap求全域性最優解,lle演算法計算量較小 多維縮放 multidimension...