推薦系統學習筆記

2021-10-09 08:26:55 字數 2009 閱讀 2442

完整的資訊流推薦系統

到業務前台的推薦系統的召回、粗排以及精排等推薦環節,

召回層面,目前已實現大規模fm統一召回模型,正逐步替代傳統的多路召回模型,並在各項指標取得了非常明顯的業務效果。召回階段,採用模型統一召回代替傳統的多路召回是個比較明顯的趨勢。

四個環節分別是:召回、粗排、精排和重排。

①模型召回

傳統的標準召回結構一般是多路召回。

模型召回的通用架構

核心思想是:將使用者特徵和物品特徵分離,各自通過某個具體的模型,分別打出使用者embedding以及物品embedding。

②使用者行為序列召回

③使用者多興趣拆分

在召回階段,把使用者興趣拆分成多個embedding是有直接價值和意義的。這種興趣拆分,在召回階段是很合適的,可以定向解決它面臨的一些實際問題。對於排序環節,是否有必要把使用者興趣拆分成多個,倒覺得必要性不是太大。

④知識圖譜融合召回⑤圖神經網路模型召回

fm模型

fm、ffm、deepfm學習筆記

在重排環節,常規的做法,這裡是個策略出沒之地,就是集中了各種業務和技術策略。比如為了更好的推薦體驗,這裡會加入去除重複、結果打散增加推薦結果的多樣性、強插某種型別的推薦結果等等不同型別的策略。

從技術發展趨勢角度看,重排階段上模型,來代替各種花樣的業務策略,是個總體的大趨勢。

關於list wise排序,可以從兩個角度來說,乙個是優化目標或損失函式;乙個是推薦模組的模型結構。

所以我們首先應該明確的一點是:list wise它不是指的具體的某個或者某類模型,而是指的模型的優化目標或者損失函式定義方式,理論上各種不用的模型都可以使用list wise損失來進行模型訓練。

pair wise損失在訓練模型時,直接用兩個物品的順序關係來訓練模型,就是說優化目標是物品a排序要高於物品b,類似這種優化目標。其實pair wise的loss在推薦領域已經被非常廣泛得使用,比如bpr損失,就是典型且非常有效的pair wise的loss function,經常被使用,尤其在隱式反饋中,是非常有效的優化目標。

從模型結構上來看。因為重排序模組往往是放在精排模組之後,而精排已經對推薦物品做了比較準確的打分,所以往往重排模組的輸入是精排模組的top得分輸出結果,也就是說,是有序的。

而精排模組的打分或者排序對於重排模組來說,是非常重要的參考資訊。於是,這個排序模組的輸出順序就比較重要,而能夠考慮到輸入的序列性的模型,自然就是重排模型的首選。我們知道,最常見的考慮時序性的模型是rnn和transformer,所以經常把這兩類模型用在重排模組,這是很自然的事情。

一般的做法是:排序top結果的物品有序,作為rnn或者transformer的輸入,rnn或者transformer明顯可以考慮在特徵級別,融合當前物品上下文,也就是排序列表中其它物品的特徵,來從列表整體評估效果。rnn或者transformer每個輸入對應位置經過特徵融合,再次輸出**得分,按照新**的得分重新對物品排序,就完成了融合上下文資訊,進行重新排序的目的。

推薦系統學習筆記 推薦系統現存問題

單純以使用者和專案為驅動的推薦引擎並不能滿足相關使用者的實際需要,使用者在實際購買之中往往會結合自己的實際需要以及社交網路的推薦來做選擇 傳統的推薦演算法往往帶有很嚴重的 馬太效應 推薦的商品往往是熱門的商品,導致熱門的商品更加熱門,而處在 長尾分布 上的商品仍然得不到重視。因此,將社交網路與個性化...

推薦系統學習(二)

擴充套件閱讀 這篇 是07年的,是傳統的方法中比較經典的 了.他論述了現在推薦的問題,評分矩陣的稀疏性,以及資料量的逐漸增加,最好的總結請看pmf,這位博主總結的比較全面,該博文從問題定義,以及問題解決思路都進行了很好地說明。了解 中公式的解釋請參考原理,中詳細的推導過程可以參考pmf推導。這些總結...

推薦系統學習筆記之評測指標

調查問卷 問卷要盡可能詳細分出等級,不要只有滿意或者不滿意。2.的準確度 離線測驗 準確度是最重要的系統離線測試指標,將離線資料集劃分為訓練集和測試集,通過在訓練集上建立使用者的行為和興趣模型 使用者在測試集上的行為,並計算 行為和測試集上實際行為的重合度作為 準確度。2.1 評分 使用者對物品評分...