奇異值分解 SVD 機器學習實戰第14章)

2021-09-11 20:41:26 字數 594 閱讀 1180

svd(奇異值分解):

優點:簡化資料,去除雜訊點,提高演算法的結果;

缺點:資料的轉換可能難以理解;

適用於資料型別:數值型。

通過svd對資料的處理,我們可以使用小得多的資料集來表示原始資料集,從有雜訊的資料中抽取相關特徵,這樣做實際上是去除了雜訊和冗餘資訊,以此達到了優化資料、提高結果的目的。

最早的svd應用之一是資訊檢索。我們稱利用svd的方法為隱性語義檢索(lsi)或**語義分析(lsa)。

在lsi中,乙個矩陣是由文件和詞語組成的,當我們在該矩陣上應用svd時,就會構建出多個奇異值。這些奇異值代表了文件中的概念或主題,這一特點可以用於更高效的文件搜尋。如果我們從上千篇相似的文件中抽取出概念,那麼同義詞就會對映為同一概念。

svd的另乙個應用就是推薦系統。簡單版本的推薦系統能夠計算項或者人之家呢相似度。更先進的方法則先利用svd從資料中構建乙個主題空間,然後再在該空間下計算其相似度。

svd也可用於特徵壓縮(資料降維)。將svd用於pca主成分分析,來做資料壓縮和降噪。

SVD奇異值分解 機器學習

簡介 奇異值分解 singular value decomposition 是線性代數中一種重要的矩陣分解,是在機器學習領域廣泛應用的演算法,它不光可以用於降維演算法中的特徵分解,還可以用於推薦系統,以及自然語言處理等領域。是很多機器學習演算法的基石。奇異值分解在資料降維中有較多的應用,這裡把它的原...

奇異值分解 SVD

最近不小心接觸到了svd,然後認真看下去之後發現這東西真的挺強大的,把乙個推薦問題轉化為純數學矩陣問題,看了一些部落格,把乙個寫個比較具體的博文引入進來,給自己看的,所以把覺得沒必要的就去掉了,博文下面附原始部落格位址。一 基礎知識 1.矩陣的秩 矩陣的秩是矩陣中線性無關的行或列的個數 2.對角矩陣...

SVD奇異值分解

原文出處 今天我們來講講奇異值分解和它的一些有意思的應用。奇異值分解是乙個非常,非常,非常大的話題,它的英文是 singular value decomposition,一般簡稱為 svd。下面先給出它大概的意思 對於任意乙個 m n 的矩陣 m 不妨假設 m n 它可以被分解為 m udv t 其...