機器學習篇 SVD從初始到應用

2022-03-03 14:02:32 字數 1299 閱讀 7733

svd一般應用場景--推薦系統,影象壓縮。

1、直觀感受。

svd其實就是將矩陣分界,直觀感受如圖。就是將a矩陣分界成u,s,v三個矩陣相乘。一般推薦系統中用的多。s是對角陣,裡面的特徵值是從大到小排列的。

2、前述知識。

乙個矩陣乘以乙個向量結果還是乙個向量,並且等於原始向量的

倍,相當於對原始向量進行乙個某個方向上的拉伸。

3、矩陣壓縮

圖1

圖2對圖1,圖2來說,假設m表示是樣本個數,n表示特徵個數,則抽取s特徵中比較重要的特徵值,(因為特徵值是從大到小排列的,所以假如抽取前幾個特徵值作為保留的特徵值),則s維度減少,變成r*r,則原始m*n矩陣分解成u ---m*r(比較瘦),s--r*r(方陣),v--r*n(比較長)三個矩陣相乘。

4、原理剖析

抓住主要變換方向,所以保留特徵值比較大的方向。

5、例項講解一

svd可解釋性比較差,需要去猜。

6、例項講解二(推薦系統)

u :6*2(6代表是item個數)

v:4*2(4代表是使用者個數)

s:取前兩個比較重要的值

對映到二維圖中:找出最相似的使用者。

機器學習 整合演算法從初始到應用

一 前述 整合思想就是讓很多個訓練器決定乙個結果,目的 讓機器學習效果更好,單個不行,群毆走起。二 具體 1 概述 2 bagging模型 全稱 bootstrap aggregation 說白了就是並行訓練一堆分類器 最典型的代表就是隨機森林啦。隨機 資料取樣隨機,特徵選擇隨機 森林 很多個決策樹...

機器學習 譜聚類從初始到應用

一 前述 譜聚類 spectral clustering 是一種基於圖論的聚類方法,主要思想是把所有的資料看做空間中的點,這些點之間可以用邊連線起來。距離較遠 或者相似度較低 的兩個點之間的邊權重值較低,而距離較近 或者相似度較高 的兩個點之間的邊權重值較高,通過對所有資料點組成的圖進行切圖,讓切圖...

機器學習 xgboost從初識到應用

一 前述 在 kaggle 的很多比賽中,我們可以看到很多 winner 喜歡用 xgboost,而且獲得非常好的表現,今天就來看看 xgboost 到底是什麼以及如何應用。gradient boosting 是 boosting 的其中一種方法,所謂boosting,就是將弱分離器 f i x 組...