機器學習基礎（六十三）奇異值分解（SVD）

乙個 m×

n 的 word-doc 矩陣，經 svd 奇異值分解之後，得到 (m

×k)×

(k×n

) 的兩個子矩陣的乘積，這裡的維度資訊

k ，表示的正是從全部 word 中提煉出來的 topic，提取在某種程度上含義近似於壓縮，自然這裡提煉出來的 topic 也是去除近義詞後的結果。這也正是lsa（latent semantic analysis）（隱語義/潛藏語義/潛在語義分析）所做的工作。

矩陣的奇異值分解首先適用於矩陣非方陣的情形。設 c

m×n，

um×m

，其中

u 的列為 cc

t的正交特徵向量，vn

×n，v

的列為 ct

c的正交特徵向量，再假設

r 為

c的秩，則存在奇異值分解： c=

uλvt

其中 cc

t 和 ct

c 的特徵值相同，為 λ1

,λ2,

…,λr

。λ為 m×

n ，其中 λi

i=λ√

i ，其餘位置為0，λi

i 的值按大小降序排列

u 的每一列，

v的每一列，均與 λi

i 時，可以僅保留

u 的第一列，

λ的第乙個對角線元素（也即 λ11

）以及

v 的第一列；

svd 分解兩端同時右乘 ct

，得： cc

t=uλ

2ut

恰為對稱矩陣的分解。

奇異值分解的圖形表示如下：

從圖中可以看到

σ 雖然為m x n矩陣（m>n），但從第n+1行到m行全為零，因此可以表示成 n x n 矩陣，又由於右式為矩陣相乘，因此 u 可以表示為 m x n 矩陣，vt 可以表示為 n x n 矩陣。

比如使用者對電影的評價矩陣，可以採用 svd 的方式，其基於這樣乙個假設：

[1] svd奇異值分解

機器學習奇異值分解

奇異值分解是一種矩陣因子分解方法，是線性代數概念，但在統計學習中被廣泛使用，成為其重要工具主要應用在主成分分析潛在語義分析上奇異值分解的矩陣不需要是方陣，任意矩陣都可以進行分解，都可以表示為三個矩陣的乘積因子分解形式，分別是m階正交矩陣由降序排列的非負對角線元素組成的m n矩形對角矩陣...

機器學習基礎特徵分解，奇異值分解

對於乙個方陣行數和列數相等的矩陣 a aa，特徵向量就是指與a aa相乘的乙個非零向量 nu 等於這個非零向量的縮放，即a a nu lambda nu a 其中，lambda 稱為特徵值，nu a i 0 a lambda i nu 0 a i 01 定義將矩陣分解成一組特徵向量和特徵值。2 ...

SVD奇異值分解機器學習

簡介奇異值分解 singular value decomposition 是線性代數中一種重要的矩陣分解，是在機器學習領域廣泛應用的演算法，它不光可以用於降維演算法中的特徵分解，還可以用於推薦系統，以及自然語言處理等領域。是很多機器學習演算法的基石。奇異值分解在資料降維中有較多的應用，這裡把它的原...

機器學習基礎（六十三） 奇異值分解（SVD）

機器學習 奇異值分解

機器學習基礎 特徵分解，奇異值分解

SVD奇異值分解 機器學習

相關推薦

機器學習基礎（六十三）奇異值分解（SVD）

機器學習奇異值分解

機器學習基礎特徵分解，奇異值分解

SVD奇異值分解機器學習