1,流形及其流形學習
流形:一類特殊的連通hausdorff仿射空間
流形的本質:區域性可座標化的拓撲空間,可以看作是歐氏空間的非線性推廣
流形學習的本質:當樣本空間為乙個高維光滑流形時,要從樣本資料中學習這個高維流形的內在幾何結構或內在規律,得到對應的低維資料集,實際也就是非線性降維。
2.流形學習的主要演算法
(1)基於全域性的方法,如等距對映(isomap)
(2)基於區域性的方法,如區域性線性嵌入演算法(lle)
3.lle演算法主要分為三步:
(1)求k個近鄰的過程,這個過程使用了和kkn演算法一樣的求最近鄰的方法
(2)對每個樣本求它在鄰域裡的k個近鄰的線性關係,得到線性關係的權重係數w
(3)利用權重係數在低維里重構樣本資料
4.區域性線性嵌入演算法(lle)優點
(1)只考慮近距離點,因此無需要求流形對應的低維空間的子集為凸集;
(2)計算物件是多項式數量級的係數矩陣,計算複雜度遠遠小於全域性方法。
參考文獻;
[1]高小方.流形學習方法中的若干問題分析.山西大學計算智慧型與中文處理教育部實驗室.
[2]劉建平.區域性線性嵌入原理總結..
流形學習(一)
1 什麼是流形?經常會在 裡看到 嵌入在高維空間中的低維流形 高維的資料對於我們總是難以想像,所以最直觀的例子通常都會是嵌入在三維空間中的二維或者一維流形。比如說一塊布,可以把它看成乙個二維平面,這是乙個二維的歐氏空間,現在我們 在三維 中把它扭一扭,它就變成了乙個流形 當然,不扭的時候,它也是乙個...
流形學習t SNE,LLE,Isomap
作者 andre ye 編譯 vk analytics indiamag 主成分分析是一種強大的方法,但它往往失敗,因為它假設資料可以線性建模。pca將新的特徵表示為現有特徵的線性組合,將每個特徵乘以乙個係數。為了解決主成分分析的侷限性,人們通過對具有不同結構的資料進行應用而產生了各種各樣的技術。然...
幾種流形學習演算法
區域性線性嵌入 lle 前提假設 取樣資料所在的低維流形在區域性是線性的,即每個取樣點可以用它的近鄰點線性表示。求解方法 特徵值分解。lle演算法 計算每乙個點xi的近鄰點,一般採用k近鄰或者 領域。計算權值wij,使得把xi用它的k個近鄰點線性表示的誤差最小,即通過最小化 xi wijxj 來求出...