使用者行為資料
為了讓推薦結果個性化,就需要深入了解使用者。生活中通過「聽其言,觀其行」來了解乙個人。而對於演算法,則是分析使用者行為日誌。
長尾分布
2023年,哈佛大學的語言學家zipf 在研究英文單詞詞頻時發現,如果將單詞出現的頻率按照由高到低排列,則每個單詞出現的頻率和它在熱門排行榜中排名的常數次冪成反比。這個分布被稱為 zipf 定律。
很多人員發現,使用者行為資料也蘊含著這種規律。令 fu(k) 為對k 個物品產生過行為的使用者數,fi(k) 為被k 個使用者產生過行為的物品的數量。我們選擇 delicious 和 citeulike 資料集乙個月的原始資料進行分析,物品流行度的長尾分布和使用者活躍度的長尾分布如下:
使用者活躍度和物品流行度的關係
一般來說,不活躍的要麼是新使用者,要麼是只來過**一兩次的老使用者。一般認為,新使用者傾向於瀏覽熱門的物品,而老使用者會逐漸開始瀏覽冷門的物品。圖2-5 展示了 movielens 資料集中使用者活躍度和物品流行度之間的關係,這表明使用者越活躍,越傾向於瀏覽冷門的物品。
實戰智慧型推薦系統(14) 推薦系統架構
外圍架構 一般來說,每個 都有乙個 ui 系統,ui 系統負責給使用者展示網頁並和使用者互動。會通過日誌系統將使用者在 ui 上的各種各樣的行為記錄到使用者行為日誌中。從上面的結構可以看到,除了推薦系統本身,主要還依賴兩個條件 介面展示和使用者行為資料。推薦系統架構 推薦系統聯絡使用者和物品的主要方...
推薦系統實戰第二章 利用使用者行為資料
1 使用者行為資料簡介 1.1 使用者行為分類 a.顯性反饋行為 使用者明確表示對物品喜好的行為 比如評分,反饋喜好與否 b.隱性反饋行為 頁面瀏覽行為 2 使用者行為分析 2.1 使用者活躍度和物品流行度的分布 長尾分布 英文中大部分詞的詞頻很低,只有很少的詞被經常使用 2.2 使用者活躍度和物品...
實戰智慧型推薦系統(4) 什麼是好的推薦系統?
推薦系統與搜尋引擎 1 資訊過載。隨著資訊科技和網際網路的發展,人們逐漸從資訊匱乏走向了資訊過載時代。比如說如果在小超市買個東西,一件一件挑就是了。但是在 網買東西,假設不使用搜尋引擎,大量的物品讓使用者根本無法選擇。2 使用者需求不明確。如果使用者需求明確,正如前面舉得例子。假如我明確知道自己想要...