推薦系統可能涉及的常見演算法
協同過濾的基本思想
協同過濾一般指在海量的使用者中發掘出一小部分和你品味比較類似的。
實現協同過濾步驟
收集使用者偏好方法相似度
把資料看成空間中的向量(降噪,歸一化)
基於距離計算相似度
計算歐幾里得空間中兩個點的距離
基於相關係數計算相似度
皮爾遜相關係數一般用於計算兩個變數間聯絡的緊密程度,取值在-1到1之間
基於余弦夾角計算相似度
基於tanimoto 係數計算相似度
鄰居(使用者,物品)的圈定
固定數量的鄰居:k-neighborhoods
基於相似度門檻的鄰居:threshold-based neighborhoods
基於使用者的協同過濾演算法usercf
基於使用者的協同過濾,通過丌同使用者對物品的評分來評測使用者乊間的相似性,基於用 戶乊間的相似性做出推薦。
簡單來講就是:給使用者推薦和他興趣相似的其他使用者喜歡的物品。
原理
計算上,就是將乙個使用者對所有物品的偏好作為乙個向量來計算使用者之間的相似度, 找到 k 鄰居後,根據鄰居的相似度權重以及他們對物品的偏好,**當前使用者沒有偏好的未涉及物品,計算得到乙個排序的物品列表作為推薦。
公式
使用者相似度(可以用余弦相似度):
使用者u對商品i的感興趣程度:
基於物品的協同過濾演算法itemcf
基於item的協同過濾,通過使用者對丌同item的評分來評測item之間的相似性,基於 item之間的相似性做出推薦。
簡單來講就是:給使用者推薦和他之前喜歡的物品相似的物品。
原理
從計算的角度看,就是將所有使用者對某個物品的偏好作為乙個向量來計算物品之間的相似度,得到物品的相似物品後,根據使用者歷史的偏好**當前使用者還沒有表示偏好的物品,計算得到乙個排序的物品列表作為推薦。
公式:
物品相似度(懲罰了熱門物品j的權重):
使用者u對商品i的感興趣程度:
1.基於物品的協同 過濾演算法,是目前電子商務採用最廣泛的推薦演算法。
2.在社交網路站點中,user cf 是乙個更丌錯的選擇,user cf 加上社會網路資訊,可 以增加使用者對推薦解釋的信服程度。
推薦系統召回之userCF
通過計算使用者之間的相似度。這裡的相似度指的是兩個使用者的興趣相似度。假設對於使用者u uu和v vv,n u n u n u 指的是使用者u uu喜歡的物品集合,n v n v n v 指的是使用者v vv uu和v vv的相似度 w uv n u n v n u n v w frac wuv n...
推薦系統01推薦系統入門
這裡給出了三個主要原因 網際網路規模增長迅速,資料量資訊過載,人們很難獲得有效資訊 資料太多了,我看不過來 搜尋引擎的方式只能滿足有確切主題 知道如何描述的資訊,沒有辦法搜尋自己模糊不清的需求 人們需要個性化服務來減少不必要的工作。在這樣的背景下,推薦系統應運而生,推薦系統究竟實現了怎樣的工作,實際...
Min Hash和推薦系統
min hash和推薦系統 it癮 標籤 未分類 分享到 出處 前幾年看google news recommendation的那篇 對裡面提到的minhash的演算法基本沒有注意,因為之前的習慣都是只注意 的模型那塊,至於怎麼優化模型一般都只是掃一眼。不過最近看了大量的google 發現google...