機器學習基礎7 推薦系統

2022-08-11 23:39:24 字數 1496 閱讀 6713

近十年以來,推薦系統迅猛發展,比如說亞馬遜的商品推薦等.而netflix的比賽,讓推薦系統更廣為人知.

資訊量**所帶來的影響非常深遠,衍生出了一種個性化思想,連線使用者和某一項事物.

傳統的瀏覽模式成為歷史,我們必須尋找一種新的模式.

推薦系統的例子:

電影推薦

商品推薦

**推薦

使用者關係判斷(比如微博上的使用者之間的關係)

藥物靶相互作用(**感冒的藥物同時也有**頭疼的作用)

構建乙個推薦系統:

1.根據流行度.  

類似微博的熱榜,會展現在使用者面前,但是這樣的推薦缺乏個性化.至少我就對哪個明星幹了啥沒什麼興趣.

2.分類模型

使用使用者的資訊,購買歷史,商品的資訊,以及其他的一些進行,通過乙個分類模型,來判斷使用者是否感興趣.

但是這樣做同樣存在問題,比如說使用的特徵可能並不全.

3.買嬰兒尿布的人也會買嬰兒濕巾

這種現象稱為同現購買

我們可以畫出乙個同現矩陣

比如說我們要檢視嬰兒尿布的次數向量.以下對應的數量和品類:

[0 ... 4 ... 100 ....]

*** 奶嘴 濕巾

對上面的次數進行排序,很明顯,濕巾是最多的數量.

那麼我們就推薦濕巾?

克服流行商品推薦裡過強:

現在我們不買嬰兒尿布了,我們買兒童玩具

[0(***) ... 100w(尿布) ... 濕巾 ...]

很明顯,因為尿布的數量巨大,導致只會推薦尿布(尿布數量巨大不是因為買玩具的同時喜歡買尿布,而是因為尿布的需求量確實大).

同現矩陣規格化:

jaccard相似度演算法:

同時購買商品i和j的人數 / 購買了商品i或j的人數

也有其他的規格化演算法,比如余弦相似度.

但是這個方法也有一定的侷限性,比如只會考慮當前的狀態,不考慮歷史情況.

另外,如果購買了很多商品怎麼辦?這需要使用權重係數了.

冷啟動問題:

這也是乙個問題,就是在沒有使用者資料的情況下,如何進行相似度計算?

end

課程:機器學習基礎:案例研究(華盛頓大學)

week5 [recommender systems,co-occurrence matrices for collaborative filtering]

機器學習 推薦系統

在各類 軟體或各大購物 裡,通常會存在推薦系統。它可以根據每個使用者的個人喜好為使用者推薦相應的歌曲 商品 從而增加使用者體驗,並提高了產品的銷量。因此,推薦系統是乙個很值得學習的應用領域。如下圖所示,這是4個使用者對5部電影的評價,我們要求評價只能是0 5之間的數。可以看出,有一些已經打分了,有一...

機器學習2 推薦系統

問題 topk ctr步驟 feature recall 基於熱度,基於使用者興趣標籤,基於cf,基於fm sort lr,gbdt,gbdt lr,fm,dnn ad評價指標 accuracy 正確的樣本 總樣本 precision 為正類正確的樣本數 為正類的樣本數 recall 為正類正確的樣...

機器學習(10) 推薦系統

估計這章內容後面來的概率也比較低吧,學到一點思想,但畢竟現在推薦系統作為企業超看重的部分,發展較好,這些內容是不夠的,太入門了 推薦系統能領悟特徵學習的思想,不需要手動建立特徵 未防止後面看不懂,這裡做個說明 nu表示 使用者數量,nm表示電影數量,r i,j 1表示使用者j看過電影i,y i,j ...