區域性線性嵌入(lle)
前提假設:取樣資料所在的低維流形在區域性是線性的,即每個取樣點可以用它的近鄰點線性表示。
求解方法:特徵值分解。
lle演算法:
計算每乙個點xi的近鄰點,一般採用k近鄰或者ξ領域。
計算權值wij,使得把xi用它的k個近鄰點線性表示的誤差最小,即通過最小化||xi-wijxj||來求出wij.
保持權值wij不變,求xi在低維空間的象yi,使得低維重構誤差最小。
多維尺度變換(mds)
等距對映(isomap)
基本思想:建立在多維尺度變換(mds)的基礎上,力求保持資料點的內在幾何性質,即保持兩點間的測地距離。
前提假設:
核心:
估計兩點間的
測地距離:
拉普拉斯特徵對映(laplacian eigenmap)
基本思想:在高維空間中
離得很近的點投影到低維空間中的象也應
該離得很近。
求解方法:求解圖拉普拉斯運算元的廣義特徵值問
題。
流形學習(一)
1 什麼是流形?經常會在 裡看到 嵌入在高維空間中的低維流形 高維的資料對於我們總是難以想像,所以最直觀的例子通常都會是嵌入在三維空間中的二維或者一維流形。比如說一塊布,可以把它看成乙個二維平面,這是乙個二維的歐氏空間,現在我們 在三維 中把它扭一扭,它就變成了乙個流形 當然,不扭的時候,它也是乙個...
流形學習t SNE,LLE,Isomap
作者 andre ye 編譯 vk analytics indiamag 主成分分析是一種強大的方法,但它往往失敗,因為它假設資料可以線性建模。pca將新的特徵表示為現有特徵的線性組合,將每個特徵乘以乙個係數。為了解決主成分分析的侷限性,人們通過對具有不同結構的資料進行應用而產生了各種各樣的技術。然...
十 Sklearn流形學習
參考url 流形學習是一種無監督評估器,它試圖將乙個低維度流形嵌入到乙個高維度空間來描述資料集。通過觀察這個資料集,可以看到資料集中選中的x值和y值並不是對資料的最基本描述 即使放大 縮小或旋轉資料,hello 仍然會很明顯。這說明x和y的值並不是資料間關係的必要基礎特徵。這個例子中真正的基礎特徵是...