資料產品 推薦演算法

2022-07-30 17:12:12 字數 1460 閱讀 2060

總結下工作中常用的推薦演算法

1.基於內容的推薦演算法(簡單)

2.基於使用者的推薦演算法(簡單)

3.協同過濾推薦演算法(相對複雜)

第一種和第二中演算法的基礎在於標籤體系質量情況。第三種需要對使用者的行為進行大規模的收集,取決於埋點質量情況。

實現協同過濾的步驟

1、收集使用者偏好

2、資料清洗

3、找到相似的使用者或物品

4、計算推薦

3.1收集使用者偏好:

例如:

假設我們選區評分作為計算偏好如下表:

每行3個字段,依次是使用者id,物品id,使用者對物品的評分(0-5分,間隔為0.5分)

3.2計算相似性

根據使用者,物品,評分,計算出什麼人喜歡什麼,以及程度

相似性的度量計算方式有下列幾種(包括但不限):

1.歐氏距離相似度

2.皮爾森相似度

3.余弦相似度

4.曼哈頓距離相似度  

3.2.1假設本次取「歐式距離」計算,計算如下:

3.2.2當得到歐式距離後,我們使用歐式距離相似度計算公式:

s(相似度)= 1  /   p(歐式距離) +1

當p越小的時候(也就是距離越小的時候),s越大,說明相似度越高

3.3我們根據上訴計算方式得到如下**:

結論:

可以看到,當最後一列相似度的數值越大,說明與使用者01的相似度越高。

所以我們相向使用者04推薦物品wp_02商品

資料 產品書籍推薦

邏輯思考 1.學會提問 批判性思維指南 2.簡單邏輯學 改變思維方式第一書 3.批判性思維 帶你走出思維的誤區 4.思考,快與慢 溝通協調 1.非暴力溝通 2.高難度談話 3.卡內基溝通與人際關係 4.人性的弱點 5.身份的焦慮 需求分析 1.十年產品事 2.啟示錄 打造使用者喜愛的產品 3.創新者...

推薦演算法python資料集 推薦演算法資料集

movies recommendation movielens 基本內容 movielens資料集由grouplens研究組在 university of minnesota 明尼蘇達大學 與我們使用資料集無關 中組織的。movielens是電影評分的集合,有各種大小。資料集命名為1m,10m和20...

快速產品原型思路和產品推薦

快速做產品原型思路和產品推薦 1 axure 一天能做7個頁面,可以從0快速開發,不用基於,不用等待美工,不能生產使用。2 vjpage 宣稱生成的 可以直接用於開發 優勢是響應式 可用於生產 基於bootstrap,適合後台系統,適合所有人使用 1 優勢是可用於生產,但是只能美工和程式設計師再加工...