推薦系統 召回 冷啟動

2021-10-18 22:25:40 字數 797 閱讀 2460

冷啟動問題主要分為兩類:

這裡主要分享兩個演算法,乙個是利用使用者的註冊資訊進行冷啟動,乙個是利用物品本身資訊進行冷啟動。

這裡主要利用使用者註冊時填寫的人口統計學資訊,如年齡、性別、職業、民族、學歷和居住地

獲取使用者的註冊資訊

根據註冊資訊對使用者進行分類

給使用者推薦他所屬那個分類中使用者喜歡的物品

其中核心問題是計算每種分類(特徵)的使用者喜歡的物品,即對於每種類別(特徵)f,計算具有這種特徵的使用者對各個物品 i 的喜好程度p(f,i)。

計算喜歡物品 i 的使用者中具有特徵f的比例:

p(f,i)是具有特徵f的人對物品i的喜愛程度;令n(i)為喜歡物品i的使用者集合,u(f)是具有特徵f的使用者集合。分子是喜歡物品 i 的人中具有特徵 f 的人;分母是喜歡物品 i 的人的個數。

一般物品都有自己的內容資訊,比如jd資料庫中的adm.adm_s03_glb_sku_profile_da就是商品寬表,包含了商品名稱、長寬高、重量等資訊。其中最值得關注的是商品名稱這個文字資訊,可以使用glove/bert預訓練模型將其表示成詞向量。這樣,每個商品的語義特徵(nlp)+數值特徵可以構成乙個商品向量(這就是item2vec思想)。對於物品相似度的計算就可以通過余弦相似度進行計算,就可以比較這個新商品和歷史商品的相似度了。

在得到物品之間的相似度之後,就可以用前面的itemcf進行推薦了。商品的」相似度「在這裡就是基於內容的相似度。

推薦系統 冷啟動問題

使用者冷啟動 即提供非個性化的推薦,即提供熱門排行榜,之後再個性化 使用者註冊資訊分3中 p f,i n i u f n i an i 是喜歡物品i的使用者集合,u f 是具有特徵f的使用者集合,引數a的目的是解決資料係數的問題。比如有乙個物品只被乙個使用者喜歡過,而這個使用者剛好就有特徵f,那麼p...

推薦系統冷啟動問題

一 冷啟動問題簡介 如何在沒有大量使用者資料的情況下設計個性化推薦系統並讓使用者對推薦結果滿意從而願意使用推薦系統,就是冷啟動問題。1.分類 3類 二 利用使用者註冊資訊解決冷啟動問題 即利用年齡 性別等資料。推薦一些熱門商品 該方法粒度較粗 如若是女性,則推薦女性都喜歡的商品。使用者註冊資訊含3種...

推薦系統 冷啟動問題

什麼是冷啟動?冷啟動問題的型別 主要分為三大類,使用者冷啟動,物品冷啟動和系統冷啟動。其實前兩者並不能想到,因為冷啟動問題說白了就是系統沒有使用者和物品的資料獲得根據做演算法推薦分析,所以使用者冷啟動和物品冷啟動是必然考慮。下面稍微的介紹一下者三大類 之前接觸過一些平台類似的解決這些冷啟動的方式,大...