d(
x,y)
=∑nk
=1(x
k−yk
)2−−
−−−−
−−−−
−−−√
1.如果資料密集(所有資料幾乎都有屬性值,屬性值量級重要),就用歐幾里德演算法
2.資料受級別膨脹影響(不同的使用者使用不同的評分標準),就用皮爾遜相關係數演算法
3.資料稀疏性強,就考慮用夾角余弦相似度演算法
cosine相似度,其實就是歸一化後的點積結果,
pearson相關係數是去中心化&歸一化的點積結果
修正cosine相似度,也是去中心化&歸一化的點積結果,與pearson的差別就在於去中心化的差異(上面描述的)
* 打分:rmse(均方根誤差)
* top-n:f11f
1=1r
+1p
不妨舉這樣乙個例子:某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。撒一大網,逮著了700條鯉魚,200只蝦,100只鱉。那麼,這些指標分別如下:
正確率 = 700 / (700 + 200 + 100) = 70
%召回率 = 700 / 1400 = 50
%f值 = 70
% * 50% * 2 / (70% + 50%) = 58.3%
推薦系統相關技術
推薦演算法是推薦系統的核心,但為了產生精確而且有效的推薦,越來越多的技術融合到推薦系統的研究中,然後提出各種不同的推薦演算法。目前在推薦系統中應用的核心技術包括 1 資訊檢索技術 ir 推薦系統根據使用者需求,搜尋產品類別資料庫,然後返回使用者需要的資訊,其搜尋過程可以實時進行,也可以定期執行,同時...
推薦演算法之好友推薦
寫點自己的理解,大牛請直接略過。好友推薦裡有推薦一些你可能認識的人,其中二度人脈是其中一種。比如 何炅和謝娜 在微博上相互關注,那用二度人脈的方法就是找和謝娜相互關注的人 如 張杰,海濤,某人 這時候 張杰,海濤,某人 就是何炅的二度人脈,排除掉何炅已經相互關注的張杰,剩下 張杰和某人 於是何炅發現...
推薦演算法分類
1 item based collective filtering 總結 物以類聚 很多 的核心演算法之一 原因 item的增長速度遠小於user的增長速度 方法 離線計算item的相似度矩陣供線上使用 缺點 由於基於item的相似性,故推薦的item相似,缺乏多樣性 2 user based co...