推薦系統 基於UGC的推薦

2021-10-12 17:50:06 字數 619 閱讀 9984

使用者用標籤描述對物品的看法,所以使用者生成標籤(ugc)是聯絡使用者和物品的紐帶,也是反應使用者興趣的重要資料來源。

乙個使用者標籤行為的資料集一般有乙個三元組(使用者,物品,標籤)的集合組成,其中一條記錄(a,b,c)表示使用者a給物品b打上了標籤c

乙個簡單的演算法:

統計每隔使用者最常用的標籤

對於每隔標籤,統計被打過這個標籤次數最多的物品

對於乙個使用者,首先找到他常用的標籤,然後找到具有這些標籤的最熱門的物品,推薦給他

所以使用者對物品的興趣公式

其中,n a.c是使用者a打了多少c標籤,n c.b是物品b被打過標籤c的次數

簡單演算法中 直接將使用者打出標籤的次數和物品得到的標籤次數相剩,可以簡單地表現處使用者對物品某個特徵的興趣

這種辦法傾向於給熱門標籤(誰都會給的標籤,如「大片」,「搞笑」等),熱門物品(打標籤人數最多)比較大的權重,如果乙個熱門物品同時對應著熱門標籤,那麼它就是「霸榜」,推薦的個性化,新穎度就會降低

類似的問題,出現在新聞內容關鍵字提取中,比如以下新聞中,那個關鍵字應該獲得更高的權重??

採用tf-idf演算法

推薦系統之 UGC標籤推薦方式

資料 演算法 對於上面的演算法,使用者u對物品i的興趣公式如下 p u i b n u,b nb,i p u,i sum b n p u,i b nu,b n b,i 演算法缺點 演算法改進 這裡利用了tf idf的思想,通過上面的公式就可以對熱門標籤進行懲罰。其中分子表示的使用者u的常用標籤,分母...

推薦系統 基於itemCF推薦模型

雖然目前工業界很少再直接通過itemcf來進行推薦,但可以從這個演算法中體會到這種集體智慧型的應用。充分利用集體智慧型,即在大量的人群的行為和資料集中收集答案,以幫助我們對整個人群得到統計意義上的結論,推薦的個性化程度高。基於以下兩個出發點 1 興趣相近的使用者可能會對同樣的東西感興趣 2 使用者可...

推薦系統02 基於近鄰的推薦

推薦策略 近鄰推薦方法的關鍵點 推進系統要找到的是最優項 best item 和最優n項 top n 符號定義說明 使用者集u user 物品集i item 評價分數集合s score ru i 是使用者u對i的評分iu 是使用者u評分過的物品集合ui 是對i打過分的使用者集合iu v 同時被使用者...