使用者分析
新使用者:傾向於瀏覽熱門商品
老使用者:逐漸開始瀏覽冷門商品
新穎度覆蓋度
離線實驗
使用者調查:
新演算法最終上線條件
基尼係數
覆蓋度:
itemcf演算法的**結果比usercf略高
itemcf可以額預先算好個個物品的相似度,**速度快
如果物品的變更速度快,武平縣速度的矩陣頻繁更新需要的代價太大,使用usercf,如新聞**
冷啟動三類問題:
使用者冷啟動(新增的使用者,沒有使用者歷史資料)
物品冷啟動(新增的物品)
系統冷啟動(前兩者結合)
標籤種類
標籤推薦
p (u
,i)=
∑bnu
,b×n
i,
bp(u,i) = \sum_\times
p(u,i)
=b∑
nu,
b×n
i,bb−
標籤
b−標籤 nu,
b−使用者
u打過標
籤b的數
量nu
,b
−使用者u
打過標籤
b的數量
n i,
b−物品
i被打過
標籤b的
數量
ni,b
−物品i
被打過標
籤b的數
量 演算法缺陷p(u
,i)=
∑bnu
,b
log(1
+nb,
u)×n
i,
bp(u,i) = \sum_\frac})}\times
p(u,i)
=b∑
log(1+
nb,
u)n
u,b
×n
i,bnb
,u−標
籤b被多
少不同用
戶使用過
nb,u
−標籤b
被多少不
同使用者使
用過通過上面的公式就可以對熱門標籤進行懲罰。其中分子表示的使用者u的常用標籤,分母的log部分表示的該標籤在其他使用者的使用情況。也就是該標籤的流行度,如果該標籤流行度比較大,該標籤的總體計算就會權重減低。
同樣的思想我們可以對熱門物品進行懲罰:
p (u
,i)=
∑bnu
,b
log(1
+nb,
u)×n
i,
blog(
1+nb
,i
)p(u,i) = \sum_\frac})}\times \frac})}
p(u,i)
=b∑
log(1+
nb,
u)n
u,b
×log(1
+nb
,i)
ni,
b
n b,
i−物品
i被多少
不同使用者
打過標籤
nb,i
−物品i
被多少不
同使用者打
過標籤
實現思路
找到使用者使用過的標籤和使用的次數
找到這些標籤被多少使用者使用過
找到被打過這些標籤的電影
找到這些電影被多少個不同使用者打過標籤
得到使用者u對這些電影的興趣結果
對興趣值做倒敘排列,取得使用者感興趣的電影
推薦系統11 《推薦系統實踐》總結
在之前我也看了很多人寫的推薦系統的部落格,理論的 演算法的都有,多是個人的理解和感悟,雖然很深刻,但是對於自己而言還是不成系統,於是我參考大牛項亮編著的 推薦系統實踐 將該領域知識系統整理一遍,與大家一起學習。本系列對應的 請檢視 前面總結推薦系統常用的資料 演算法 架構等,具體內容清檢視本系列推薦...
機器學習演算法 11 推薦系統實戰
from numpy import from numpy import linalg as la 載入資料 使用者 菜餚矩陣 行為 使用者,列為希餚,表示使用者對某個菜餚的評分 def loadexdata2 return 0,0,0,0,0,4,0,0,0,0,5 0,0,0,3,0,4,0,0,...
推薦系統架構 推薦系統(1) 業界推薦系統架構
1.1業界主流推薦系統架構 業界推薦系統通用架構 1.2使用者本身資料 1.3物品本身資料 1.4使用者行為資料 2.1基於離線訓練的推薦系統架構設計 常用演算法 邏輯回歸 logistics regression 梯度提公升決策樹 gbdt 和因式分解 fm 架構設計 2.2面向深度學習的推薦系統...