推薦系統冷啟動問題的常見解決方案

2021-08-16 10:09:29 字數 1856 閱讀 9119

1.冷啟動問題定義

推薦系統需要根據使用者的歷史行為和興趣**使用者未來的行為和興趣,對於bat這類大公司來說,它們已經積累了大量的使用者資料,不發愁。但是對於很多做純粹推薦系統的**或者很多在開始階段就希望有個性化推薦應用的**來說,如何在對使用者一無所知(即沒有使用者行為資料)的情況下進行最有效的推薦呢?這就衍生了冷啟動問題。

2.冷啟動的分類

冷啟動問題主要分為3類:

3.冷啟動問題的解決方案

3.1提供非個性化的推薦

最簡單的例子就是提供熱門排行榜,可以給使用者推薦熱門排行榜,等到使用者資料收集到一定的時候,再切換為個性化推薦。

關於熱門排行榜解決推薦問題的理論測試,可以參考著篇文章performance of recommender algorithms on top-n recommendation tasks.

並且netflix的研究也表明新使用者在冷啟動階段確實是更傾向於熱門排行榜的,老使用者會更加需要長尾推薦

(參考知乎:嚴林-回答)

3.2利用使用者註冊資訊

使用者的註冊資訊主要分為3種:

這種個性化的粒度很粗,假設性別作為乙個粒度來推薦,那麼所有剛註冊的女性看到的都是同樣的結果,但是相對於男女不區分的方式,這種推薦精度已經大大提高了。

舉乙個簡單例子說明下:

利用使用者註冊資訊進行推薦

3.3選擇合適的物品啟動使用者的興趣下面以網易雲**私人fm為例,來看一看它是怎麼做的

網易雲** - 私人fm

幽默的文案加上適當的引導,使用者在使用過程中也是會很開森的~

參考知乎:劉彥彬 - 回答

3.4利用物品的內容資訊

用來解決物品的冷啟動問題,即如何將新加入的物品推薦給對它感興趣的使用者。物品冷啟動問題在新聞**等時效性很強的**中非常重要,因為這些**時時刻刻都有新物品加入,而且每個物品必須能夠再第一時間展現給使用者,否則經過一段時間後,物品的價值就大大降低了。

針對協同過濾的兩種推薦演算法——usercf演算法、itemcf演算法來分別了解一下物品冷啟動的問題。

常見物品的內容資訊

3.5採用專家標註

很多系統在建立的時候,既沒有使用者的行為資料,也沒有充足的物品內容資訊來計算物品相似度。這種情況下,很多系統都利用專家進行標註。

代表系統:個性化網路電台pandora、電影推薦**jinni

以pandora電台為例,pandora雇用了一批**人對幾萬名歌手的歌曲進行各個維度的標註,最終選定了400多個特徵。每首歌都可以標識為乙個400維的向量,然後通過常見的向量相似度演算法計算出歌曲的相似度。

以上均為書中描述到的方法,下面再介紹兩種方法

參考自:劉彥彬 - 回答

3.6利用使用者在其他地方已經沉澱的資料進行冷啟動所以這種方法的前提是,引導使用者通過社交網路賬號登入,這樣一方面可以降低註冊成本提高轉化率;另一方面可以獲取使用者的社交網路資訊,解決冷啟動問題。

3.7利用使用者的手機等興趣偏好進行冷啟動

推薦系統 冷啟動問題

使用者冷啟動 即提供非個性化的推薦,即提供熱門排行榜,之後再個性化 使用者註冊資訊分3中 p f,i n i u f n i an i 是喜歡物品i的使用者集合,u f 是具有特徵f的使用者集合,引數a的目的是解決資料係數的問題。比如有乙個物品只被乙個使用者喜歡過,而這個使用者剛好就有特徵f,那麼p...

推薦系統冷啟動問題

一 冷啟動問題簡介 如何在沒有大量使用者資料的情況下設計個性化推薦系統並讓使用者對推薦結果滿意從而願意使用推薦系統,就是冷啟動問題。1.分類 3類 二 利用使用者註冊資訊解決冷啟動問題 即利用年齡 性別等資料。推薦一些熱門商品 該方法粒度較粗 如若是女性,則推薦女性都喜歡的商品。使用者註冊資訊含3種...

推薦系統 冷啟動問題

什麼是冷啟動?冷啟動問題的型別 主要分為三大類,使用者冷啟動,物品冷啟動和系統冷啟動。其實前兩者並不能想到,因為冷啟動問題說白了就是系統沒有使用者和物品的資料獲得根據做演算法推薦分析,所以使用者冷啟動和物品冷啟動是必然考慮。下面稍微的介紹一下者三大類 之前接觸過一些平台類似的解決這些冷啟動的方式,大...