推薦系統中冷啟動問題

2021-08-02 20:16:24 字數 1774 閱讀 2885

前言

推薦系統需要根據使用者的歷史行為和興趣來**使用者未來的行為和興趣,因此大量的使用者行為資料就稱為了推薦系統的重要組成部門和先決條件。但是,很多個性化推薦系統的**從開始就沒有這些使用者行為資料,所以如何在沒有大量使用者行為資料的情況下進行個性化推薦並且讓使用者對推薦的結果感到滿意,這就是冷啟動問題。

冷啟動問題分類和解決方法

冷啟動問題主要分三類:

使用者冷啟動

使用者冷啟動主要解決如何給乙個新的使用者做個性化推薦。當乙個新使用者(新註冊的)到來時,我們沒有他的歷史行為資料,所以無法根據他的歷史行為去**他的興趣,從而無法去做個性化推薦。

物品冷啟動

物品冷啟動主要解決如何將新的物品推薦給可能對其感興趣的使用者。

主要解決方法:

提供非個性化推薦,最簡單例子就是熱門排行榜推薦,先給使用者推薦熱門的物品,然後等到使用者資料收集到一定的時候再進行個性化推薦。

利用使用者註冊提供的年齡性別等做粗粒度的個性化推薦。

要求使用者在登入的時候對一些物品的反饋,收集使用者對這些物品的興趣資訊,然後給使用者做推薦。

對於新物品,可以利用物品的內容資訊,將它們推薦給喜歡過和該物品相似物品的使用者。

冷啟動問題具體解決方法

舉例說明:假設乙個新使用者註冊,首先獲取他的使用者資訊,比如他是乙個24歲的男性,是乙個研二學生。然後查詢三張離線計算好的相關表:性別-電影相關表,年齡-電影相關表,職業-電影相關表,從這三張表中查詢出所有的電影然後按照一定的權重相加,給使用者返回推薦列表。

(實際應用中還可以考慮組合特徵)。

選擇合適的物品啟動使用者的興趣

解決使用者冷啟動問題的另乙個方法是在新使用者第一次訪問推薦系統時,不立即給使用者展示推薦結果,而是給使用者提供一些物品,讓使用者反饋他們對這些物品的興趣,然後根據這些使用者反饋給使用者提供個性化推薦。很多的推薦系統採取了這種方式來解決使用者冷啟動問題。

對於這些通過使用者給物品的反饋來收集使用者興趣,從而對使用者進行推薦,他們需要解決的首要問題就是如何選擇物品讓使用者進行反饋。(一般這種情況下,會影響使用者的體驗感)

一般來說,能夠用來啟動使用者興趣的物品需要具有以下特點:

(1)比較熱門:如果要讓使用者對乙個物品反饋,前提是使用者知道這個物品時什麼?以電影為例,如果一開始讓使用者進行反饋的電影都很冷門,而使用者不知道這些電影的情節和內容,也就無法對它們做出準確的反饋。

(2)具有代表性和區分性:啟動使用者興趣的物品不能是大眾化或者流行度很高的,因為這樣的物品對使用者沒有區分性。比如,有一部電影票房很高很受大家歡迎,這樣的電影幾乎所有的使用者都會喜歡,因而無法區分使用者的興趣。

(3)啟動物品集合需要多樣性:在冷啟動時,我們不知道使用者的興趣,而使用者的興趣和廣泛,可能非常多,為了匹配多樣的興趣,我們需要提供具有很高的覆蓋率的啟動物品集合。

利用物品的內容資訊

物品冷啟動需要解決的問題是如何將新加入的物品推薦給對它感興趣的使用者。物品冷啟動在新聞**等時效性很強的**中非常重要,因為那些**中時時刻刻都有新加入的物品,而且每個物品必須能夠在第一時間展現給使用者,否則一段時間後物品的價值就大大降低了。

在前篇部落格中提到兩種推薦演算法,usercf和itemcf。實際上,usercf對物品冷啟動問題不是非常敏感。usercf在給使用者推薦時,會首先找到和使用者興趣相似的一群使用者,然後給使用者推薦這一群使用者喜歡的物品。所以,當乙個新物品加入時,總會有一些使用者通過某種途徑看到過新物品。

常見的物品資訊:物品的內容資訊多重多樣,不同型別的物品也會有不同的內容資訊。例如電影,內容資訊一般有標題、導演、演員、國家、年代、還有電影介紹等;例如圖書,內容資訊一般包括標題、作者、出版社等。

推薦系統 冷啟動問題

使用者冷啟動 即提供非個性化的推薦,即提供熱門排行榜,之後再個性化 使用者註冊資訊分3中 p f,i n i u f n i an i 是喜歡物品i的使用者集合,u f 是具有特徵f的使用者集合,引數a的目的是解決資料係數的問題。比如有乙個物品只被乙個使用者喜歡過,而這個使用者剛好就有特徵f,那麼p...

推薦系統冷啟動問題

一 冷啟動問題簡介 如何在沒有大量使用者資料的情況下設計個性化推薦系統並讓使用者對推薦結果滿意從而願意使用推薦系統,就是冷啟動問題。1.分類 3類 二 利用使用者註冊資訊解決冷啟動問題 即利用年齡 性別等資料。推薦一些熱門商品 該方法粒度較粗 如若是女性,則推薦女性都喜歡的商品。使用者註冊資訊含3種...

推薦系統 冷啟動問題

什麼是冷啟動?冷啟動問題的型別 主要分為三大類,使用者冷啟動,物品冷啟動和系統冷啟動。其實前兩者並不能想到,因為冷啟動問題說白了就是系統沒有使用者和物品的資料獲得根據做演算法推薦分析,所以使用者冷啟動和物品冷啟動是必然考慮。下面稍微的介紹一下者三大類 之前接觸過一些平台類似的解決這些冷啟動的方式,大...