1、分類思想:在原座標系裡線性不可分的資料用核函式投影(非線性對映)到另乙個空間(特徵空間),盡量使得資料在新的空間裡線性可分。
2、若直接在高維空間進行分類或回歸,需要確定非線性對映函式的形式、引數以及特徵空間的維數等問題,最大的障礙是造成「維數災難」,計算複雜。
4、核函式:兩個向量在對映過後的空間中的內積
經過數學證明,低維空間的矩陣經過核函式變化而來的矩陣==高維空間的內積矩陣,即
5、核函式優點:
1)核函式的引入避免了「維數災難」,大大減小了計算量。而輸入空間的維數n對核函式矩陣無影響,因此,核函式方法可以有效處理高維輸入。
2)無需知道非線性變換函式φ的形式和引數.
3)核函式的形式和引數的變化會隱式地改變從輸入空間到特徵空間的對映,進而對特徵空間的性質產生影響,最終改變各種核函式方法的效能。
4)核函式方法可以和不同的演算法相結合,形成多種不同的基於核函式技術的方法,且這兩部分的設計可以單獨進行,並可以為不同的應用選擇不同的核函式和演算法。
6、如何選擇核函式:
①專家的先驗性結論
②各種核函式分別建模比較
③選擇穩定性較強的高斯核函式
7、高斯核函式
高斯核函式k(x,y) =exp(-||x-y||^2/2σ^2)
8、高斯核函式的引數選擇比較難,需要實驗過程中根據經驗選擇、更改。
將輸入資料抽象成三維張量:
三維張量分解圖:
將三維張量沿三個維度展開,得到三個新矩陣:
新矩陣中,資料過於稀疏,我們使用高斯核函式對映
構造新的內積形式的矩陣(bi和fi的左奇異矩陣相同):
在張量展開的三個新矩陣上,應用高斯核函式求出bi(fi的內積)
將矩陣中的每個值,根據高斯核函式進行變換,得到的新矩陣就是bi
引數c為矩陣的標準差
bi是對稱的方陣,可以很快進行特徵值分解:
q即為u
求解核心張量
最後求近似張量:
還原資料形式,進行推薦:
奇異值和奇異值分解
理論 假設m是乙個m n階矩陣,其中的元素全部屬於域 k,也就是 實數域或複數域。如此則存在乙個分解使得 m u v 其中u是m m階酉矩陣 是半正定m n階對角矩陣 而v 即v的共軛轉置,是n n階酉矩陣。這樣的分解就稱作m的奇異值分解。對角線上的元素 i,i即為m的奇異值。直觀的解釋 在矩陣m的...
奇異值和奇異值分解
理論 假設m是乙個m n階矩陣,其中的元素全部屬於域 k,也就是 實數域或複數域。如此則存在乙個分解使得 m u v 其中u是m m階酉矩陣 是半正定m n階對角矩陣 而v 即v的共軛轉置,是n n階酉矩陣。這樣的分解就稱作m的奇異值分解。對角線上的元素 i,i即為m的奇異值。直觀的解釋 在矩陣m的...
奇異值分解
奇異值分解 singular value decomposition 是線性代數中一種重要的 矩陣分解,是矩陣分析中正規矩陣酉對角化的推廣。在訊號處理 統計學等領域有重要應用。1基本介紹 2理論描述 3幾何意義 4範數 5應用 求偽逆 平行奇異值模型 矩陣近似值 奇異值分解在某些方面與 對稱矩陣或 ...