1. itemcf演算法與usercf演算法的基本原理
演算法名稱
原理優點
相似度計算
備註user cf
給使用者推薦和他有相同興趣愛好的使用者喜歡的物品。(維護乙個使用者相似度矩陣)
著重反應和使用者相似的小群體的熱點,反應了使用者所在小型興趣群體中物品的熱門程度
w uv
=∥n(
u)∩n
(v)∥
(∥n(
u)∥n
(v)∥
w_= \frac}
wuv=(
∥n(u
)∥n(
v)∥
∥n(u
)∩n(
v)∥
n(u) 表示使用者u有過正反饋的物品集合,n(v) 表示使用者v有過正反饋的物品集合
1.新聞推薦(同群人所關注的特點)2.物品數量遠超使用者數量
item cf
給使用者推薦和他之前喜歡的物品類似的物品。(維護乙個物品相似度矩陣)
著重維繫使用者的歷史興趣,反應了使用者自己興趣的傳承,更加個性化。
w ij
=∥n(
i)∩n
(j)∥
(∥n(
i)∥∥
n(j)
∥w_ = \frac}
wij=(
∥n(i
)∥∥n
(j)∥
∥n(
i)∩n
(j)∥n(
i)
n(i)
n(i)
喜歡物品i的使用者數。n(j
)n(j)
n(j)
喜歡物品j的使用者數
1. 圖書、電影**、電子商務(使用者興趣比較固定,對熱門程度不敏感)2. 使用者數量遠超物品數量
2. user cf 和 item cf 比較
user cf
item cf
效能適用於使用者較少的場合,如果使用者很多,計算使用者相似度矩陣代價很大
適用於物品數量明顯小於使用者數的場合,如果物品很多(網頁),計算物品相似度矩陣代價很大
領域時效性較強,使用者個性化興趣不太明顯的領域,如新聞
長尾物品豐富,使用者個性化需求強烈的領域(電商)
實時性使用者有新行為,不一定造成推薦結果的立即變化
使用者新行為,一定會導致推薦結果的實時變化
冷啟動1. 在新使用者對少量物品產生行為後,不能立即地對他進行個性化推薦,因為使用者相似度錶是每隔一段時間離線計算的。2.物品上一段時間,一旦使用者對物品產生行為就可以將新物品推薦給和他產生行為的使用者興趣相似的其他使用者
推薦理由(可解釋性)
很難提供令使用者信服的推薦解釋(也有這樣做的,你有多少好友瀏覽和購買過)
利用使用者的歷史行為給使用者做推薦,可以令使用者比較信服
協同過濾演算法UserCF和ItemCF優缺點對比
usercf 效能 適用於使用者較少的場合,如果使用者很多,計算使用者相似度矩陣代價很大。領域 時效性較強,使用者個性化興趣不太明顯的領域。冷啟動 在新使用者對很少的物品產生行為後,不能立即對它進行個性化推薦,因為使用者相似度表示每隔一段時間離線計算的。新物品上線後一段時間,一旦有使用者對物品產生行...
關於UserCF和ItemCF的那點事
usercf和itemcf是協同過濾中最為古老的兩種演算法,在top n的推薦上被廣泛應用。這兩個演算法之所以重要,是因為他們使用了兩個不同的推薦系統基本假設。usercf認為乙個人會喜歡和他有相同愛好的人喜歡的東西,而itemcf認為乙個人會喜歡和他以前喜歡的東西相似的東西。這兩個假設都有其合理性...
推薦系統 01 UserCF和ItemCF
推薦系統可能涉及的常見演算法 協同過濾的基本思想 協同過濾一般指在海量的使用者中發掘出一小部分和你品味比較類似的。實現協同過濾步驟 收集使用者偏好方法相似度 把資料看成空間中的向量 降噪,歸一化 基於距離計算相似度 計算歐幾里得空間中兩個點的距離 基於相關係數計算相似度 皮爾遜相關係數一般用於計算兩...