推薦演算法 基本技術

2021-07-11 23:24:47 字數 675 閱讀 8696

d(

x,y)

=∑nk

=1(x

k−yk

)2−−

−−−−

−−−−

−−−√

1.如果資料密集(所有資料幾乎都有屬性值,屬性值量級重要),就用歐幾里德演算法

2.資料受級別膨脹影響(不同的使用者使用不同的評分標準),就用皮爾遜相關係數演算法

3.資料稀疏性強,就考慮用夾角余弦相似度演算法

cosine相似度,其實就是歸一化後的點積結果,

pearson相關係數是去中心化&歸一化的點積結果

修正cosine相似度,也是去中心化&歸一化的點積結果,與pearson的差別就在於去中心化的差異(上面描述的)

* 打分:rmse(均方根誤差)

* top-n:f11f

1=1r

+1p

不妨舉這樣乙個例子:某池塘有1400條鯉魚,300只蝦,300只鱉。現在以捕鯉魚為目的。撒一大網,逮著了700條鯉魚,200只蝦,100只鱉。那麼,這些指標分別如下:

正確率 = 700 / (700 + 200 + 100) = 70

%召回率 = 700 / 1400 = 50

%f值 = 70

% * 50% * 2 / (70% + 50%) = 58.3%

推薦系統相關技術

推薦演算法是推薦系統的核心,但為了產生精確而且有效的推薦,越來越多的技術融合到推薦系統的研究中,然後提出各種不同的推薦演算法。目前在推薦系統中應用的核心技術包括 1 資訊檢索技術 ir 推薦系統根據使用者需求,搜尋產品類別資料庫,然後返回使用者需要的資訊,其搜尋過程可以實時進行,也可以定期執行,同時...

推薦演算法之好友推薦

寫點自己的理解,大牛請直接略過。好友推薦裡有推薦一些你可能認識的人,其中二度人脈是其中一種。比如 何炅和謝娜 在微博上相互關注,那用二度人脈的方法就是找和謝娜相互關注的人 如 張杰,海濤,某人 這時候 張杰,海濤,某人 就是何炅的二度人脈,排除掉何炅已經相互關注的張杰,剩下 張杰和某人 於是何炅發現...

推薦演算法分類

1 item based collective filtering 總結 物以類聚 很多 的核心演算法之一 原因 item的增長速度遠小於user的增長速度 方法 離線計算item的相似度矩陣供線上使用 缺點 由於基於item的相似性,故推薦的item相似,缺乏多樣性 2 user based co...