近十年以來,推薦系統迅猛發展,比如說亞馬遜的商品推薦等.而netflix的比賽,讓推薦系統更廣為人知.
資訊量**所帶來的影響非常深遠,衍生出了一種個性化思想,連線使用者和某一項事物.
傳統的瀏覽模式成為歷史,我們必須尋找一種新的模式.
推薦系統的例子:
電影推薦
商品推薦
**推薦
使用者關係判斷(比如微博上的使用者之間的關係)
藥物靶相互作用(**感冒的藥物同時也有**頭疼的作用)
構建乙個推薦系統:
1.根據流行度.
類似微博的熱榜,會展現在使用者面前,但是這樣的推薦缺乏個性化.至少我就對哪個明星幹了啥沒什麼興趣.
2.分類模型
使用使用者的資訊,購買歷史,商品的資訊,以及其他的一些進行,通過乙個分類模型,來判斷使用者是否感興趣.
但是這樣做同樣存在問題,比如說使用的特徵可能並不全.
3.買嬰兒尿布的人也會買嬰兒濕巾
這種現象稱為同現購買
我們可以畫出乙個同現矩陣
比如說我們要檢視嬰兒尿布的次數向量.以下對應的數量和品類:
[0 ... 4 ... 100 ....]
*** 奶嘴 濕巾
對上面的次數進行排序,很明顯,濕巾是最多的數量.
那麼我們就推薦濕巾?
克服流行商品推薦裡過強:
現在我們不買嬰兒尿布了,我們買兒童玩具
[0(***) ... 100w(尿布) ... 濕巾 ...]
很明顯,因為尿布的數量巨大,導致只會推薦尿布(尿布數量巨大不是因為買玩具的同時喜歡買尿布,而是因為尿布的需求量確實大).
同現矩陣規格化:
jaccard相似度演算法:
同時購買商品i和j的人數 / 購買了商品i或j的人數
也有其他的規格化演算法,比如余弦相似度.
但是這個方法也有一定的侷限性,比如只會考慮當前的狀態,不考慮歷史情況.
另外,如果購買了很多商品怎麼辦?這需要使用權重係數了.
冷啟動問題:
這也是乙個問題,就是在沒有使用者資料的情況下,如何進行相似度計算?
end
課程:機器學習基礎:案例研究(華盛頓大學)week5 [recommender systems,co-occurrence matrices for collaborative filtering]
機器學習 推薦系統
在各類 軟體或各大購物 裡,通常會存在推薦系統。它可以根據每個使用者的個人喜好為使用者推薦相應的歌曲 商品 從而增加使用者體驗,並提高了產品的銷量。因此,推薦系統是乙個很值得學習的應用領域。如下圖所示,這是4個使用者對5部電影的評價,我們要求評價只能是0 5之間的數。可以看出,有一些已經打分了,有一...
機器學習2 推薦系統
問題 topk ctr步驟 feature recall 基於熱度,基於使用者興趣標籤,基於cf,基於fm sort lr,gbdt,gbdt lr,fm,dnn ad評價指標 accuracy 正確的樣本 總樣本 precision 為正類正確的樣本數 為正類的樣本數 recall 為正類正確的樣...
機器學習(10) 推薦系統
估計這章內容後面來的概率也比較低吧,學到一點思想,但畢竟現在推薦系統作為企業超看重的部分,發展較好,這些內容是不夠的,太入門了 推薦系統能領悟特徵學習的思想,不需要手動建立特徵 未防止後面看不懂,這裡做個說明 nu表示 使用者數量,nm表示電影數量,r i,j 1表示使用者j看過電影i,y i,j ...