使用者冷啟動主要解決如何給乙個新的使用者做個性化推薦。當乙個新使用者(新註冊的)到來時,我們沒有他的歷史行為資料,所以無法根據他的歷史行為去**他的興趣,從而無法去做個性化推薦。
物品冷啟動
物品冷啟動主要解決如何將新的物品推薦給可能對其感興趣的使用者。
系統冷啟動
利用使用者註冊提供的年齡性別等做粗粒度的個性化推薦。
要求使用者在登入的時候對一些物品的反饋,收集使用者對這些物品的興趣資訊,然後給使用者做推薦。
對於新物品,可以利用物品的內容資訊,將它們推薦給喜歡過和該物品相似物品的使用者。
使用者的註冊資訊可以分三種:
(1)獲取使用者的註冊資訊
(2)根據使用者的註冊資訊對使用者分類
(3)給使用者推薦他所屬分類中使用者喜歡的物品
舉例說明:假設乙個新使用者註冊,首先獲取他的使用者資訊,比如他是乙個24歲的男性,是乙個研二學生。然後查詢三張離線計算好的相關表:性別-電影相關表,年齡-電影相關表,職業-電影相關表,從這三張表中查詢出所有的電影然後按照一定的權重相加,給使用者返回推薦列表。
(實際應用中還可以考慮組合特徵)。
選擇合適的物品啟動使用者的興趣
解決使用者冷啟動問題的另乙個方法是在新使用者第一次訪問推薦系統時,不立即給使用者展示推薦結果,而是給使用者提供一些物品,讓使用者反饋他們對這些物品的興趣,然後根據這些使用者反饋給使用者提供個性化推薦。很多的推薦系統採取了這種方式來解決使用者冷啟動問題。
對於這些通過使用者給物品的反饋來收集使用者興趣,從而對使用者進行推薦,他們需要解決的首要問題就是如何選擇物品讓使用者進行反饋。(一般這種情況下,會影響使用者的體驗感)
一般來說,能夠用來啟動使用者興趣的物品需要具有以下特點:
(1)比較熱門:如果要讓使用者對乙個物品反饋,前提是使用者知道這個物品時什麼?以電影為例,如果一開始讓使用者進行反饋的電影都很冷門,而使用者不知道這些電影的情節和內容,也就無法對它們做出準確的反饋。
(2)具有代表性和區分性:啟動使用者興趣的物品不能是大眾化或者流行度很高的,因為這樣的物品對使用者沒有區分性。比如,有一部電影票房很高很受大家歡迎,這樣的電影幾乎所有的使用者都會喜歡,因而無法區分使用者的興趣。
(3)啟動物品集合需要多樣性:在冷啟動時,我們不知道使用者的興趣,而使用者的興趣和廣泛,可能非常多,為了匹配多樣的興趣,我們需要提供具有很高的覆蓋率的啟動物品集合。
利用物品的內容資訊
物品冷啟動需要解決的問題是如何將新加入的物品推薦給對它感興趣的使用者。物品冷啟動在新聞**等時效性很強的**中非常重要,因為那些**中時時刻刻都有新加入的物品,而且每個物品必須能夠在第一時間展現給使用者,否則一段時間後物品的價值就大大降低了。
在前篇部落格中提到兩種推薦演算法,usercf和itemcf。實際上,usercf對物品冷啟動問題不是非常敏感。usercf在給使用者推薦時,會首先找到和使用者興趣相似的一群使用者,然後給使用者推薦這一群使用者喜歡的物品。所以,當乙個新物品加入時,總會有一些使用者通過某種途徑看到過新物品。
常見的物品資訊:物品的內容資訊多重多樣,不同型別的物品也會有不同的內容資訊。例如電影,內容資訊一般有標題、導演、演員、國家、年代、還有電影介紹等;例如圖書,內容資訊一般包括標題、作者、出版社等。
推薦系統系列1 推薦系統評測指標
0 前言 什麼才是好的推薦系統?這是推薦系統評測的需要解決的首要問題。那我們怎麼去判斷乙個系統的好壞呢?我們認為乙個好的推薦系統不僅僅能夠準確的 使用者的行為,而且還能夠擴充套件使用者的視野,幫助使用者發現那些他們可能會感興趣但卻不那麼容易發現的東西。評價乙個推薦系統的好壞一般有幾個不同的指標,這些...
推薦系統系列 1 系統架構
最近開始學習推薦系統,在這裡做個記錄,會更新如下內容 推薦系統協同過濾與矩陣分解 推薦系統與深度學習 embedding在推薦系統中的應用 多角度審視推薦系統 推薦系統工程實現 推薦系統評估 推薦系統前沿 該系列內容是參考 王喆的深度學習推薦系統 和深度學習推薦系統 書籍 整理的,作為自己的學習筆記...
推薦系統系列3 基於決策樹做推薦系統的方法
1 決策樹概念 決策樹是基於樹的結構來進行決策的,這與人類的認知方法類似,例如 今天會下雨麼?針對此問題我們首先會進行一系列的判斷或者決策 今天陰天麼,如果陰天,大概率 會下雨 如果晴天,大概率不下雨。如圖1。圖12 文字分類 所謂文字分類,就是基於文字的特徵將其劃分到具體的類別當中,與決策樹類似。...