推薦系統 04 推薦系統冷啟動問題

2021-10-07 23:12:40 字數 1371 閱讀 1612

看完了尚矽谷機器學習和推薦系統專案實戰教程,又覺得基礎部分學的太散了。沒有把大體的體系學好。

因此,找來了 項亮的推薦系統實踐一書。打算把知識體系梳理一遍。

從前面我們知道了,基於協同過濾的推薦系統是根據使用者歷史行為和興趣**使用者未來可能的行為和興趣,所以推薦系統是在大量使用者資料的基礎上,才能構建的。但是一般情況下,乙個新系統/軟體的開發,是沒有那麼多使用者的。相反,為了提高新使用者的體驗,我們就想要引入推薦系統。那麼這樣就存在乙個問題,系統應該根據什麼模式來推薦使用者喜歡的東西?這就是乙個冷啟動問題。

冷啟動問題主要分三類:① 使用者冷啟動、 ② 物品冷啟動、 ③ 系統冷啟動。

顧名思義,使用者冷啟動的意思就是,一開始系統內有新使用者加入時候,我們不知道新使用者的行為資料,系統內也沒有。因此,在新使用者到來時,我們沒有他任何的行為資料,無法通過歷史行為**興趣,給新使用者/使用者任何個性化推薦。

解決方案:

① 提供非個性化的推薦。我們不清楚使用者的行為,但是我們知道物品的熱門排行,那麼熱門的物品有很大的可能性就是使用者喜歡的。這樣解決冷啟動後,後期在通過收集使用者行為資料,採用不同推薦方式。

② 使用者註冊資訊:我們在註冊乙個軟體的時候,系統往往會讓我們填寫資訊,包括姓名、性別、生日、興趣……系統可以通過這些標籤給我們推薦。

這種方式的個性化粒度很粗,也就是說個人資訊一般選擇項的標籤都是有限的,比如性別,我們只能劃分為男女,按照性別推薦,我們就只能把物品分成男性喜歡的和女性喜歡的兩類。

這種方式的基本流程為:獲取使用者的註冊資訊;根據使用者的註冊資訊對使用者分類;給使用者推薦他所屬分類中使用者喜歡的物品。

③ 使用者註冊登入後,給予調查。如給調查問卷、給一些物品讓使用者反饋喜歡的型別。實際上,這就是在收集使用者行為資料。

一般來講,問卷調查,讓使用者對物品進行評分來收集使用者興趣的這種方法,首先要保證調查的物品具有一下特點:熱門性;代表性和區分性;多樣性。

熱門性:保證了使用者是了解該物品的。

代表性和區分性:是為了能夠將使用者群體劃分出來的,如果一部電影大家都喜歡,那就劃分的可能就很小。

多樣性:物品型別的多樣性能夠保證物品集合有較高的覆蓋率,覆蓋使用者各種興趣愛好。

物品冷啟動主要問題就是,新物體的加入。這個物體的型別比較新穎,而且又沒有熱度指標。系統無法給它進行劃分,推薦給可能喜歡這個東西的群體。

解決方案:系統冷啟動問題,這個問題主要表現在乙個新開發的系統上,新開發的系統上可能還沒有使用者,當然也不會有行為資料。那此時我們想要讓新使用者有很好的體驗,就要解決系統冷啟動的問題。

解決方案:

在系統冷啟動時,可以引入專家的知識,通過一定的高效方式迅速建立起物品的相關度表。

例如,找到一些專家,對物品進行特徵標註。通過特徵標註以及機器學習相結合的方法解決系統冷啟動問題。

推薦系統 冷啟動問題

使用者冷啟動 即提供非個性化的推薦,即提供熱門排行榜,之後再個性化 使用者註冊資訊分3中 p f,i n i u f n i an i 是喜歡物品i的使用者集合,u f 是具有特徵f的使用者集合,引數a的目的是解決資料係數的問題。比如有乙個物品只被乙個使用者喜歡過,而這個使用者剛好就有特徵f,那麼p...

推薦系統冷啟動問題

一 冷啟動問題簡介 如何在沒有大量使用者資料的情況下設計個性化推薦系統並讓使用者對推薦結果滿意從而願意使用推薦系統,就是冷啟動問題。1.分類 3類 二 利用使用者註冊資訊解決冷啟動問題 即利用年齡 性別等資料。推薦一些熱門商品 該方法粒度較粗 如若是女性,則推薦女性都喜歡的商品。使用者註冊資訊含3種...

推薦系統 冷啟動問題

什麼是冷啟動?冷啟動問題的型別 主要分為三大類,使用者冷啟動,物品冷啟動和系統冷啟動。其實前兩者並不能想到,因為冷啟動問題說白了就是系統沒有使用者和物品的資料獲得根據做演算法推薦分析,所以使用者冷啟動和物品冷啟動是必然考慮。下面稍微的介紹一下者三大類 之前接觸過一些平台類似的解決這些冷啟動的方式,大...