source:
推薦在電商和網際網路應用中已經應用的非常廣泛,相比於根據query進行主動的搜尋,推薦是更加被動的由系統自動推出商品給使用者。搜尋的意圖比較明顯,直接由query給出,而推薦需要計算猜測使用者的意圖,根據使用者歷史資料和當前行為,基於各種模型推薦合適的商品,提公升使用者體驗,提高轉化率。不過近些年來,搜尋和推薦在底層模型和技術方面越來越趨於融合,利用機器學習的方式來改進搜尋和推薦的質量,像搜尋排序ltr等等。
推薦系統需要考慮使用者、平台、內容提供方之間的共贏,推薦系統可以增加長尾銷售能力,增加使用者粘性和提高使用者體驗,提高轉化率以及商業收入。
先說一下在我們應用內容分發平台中幾種推薦演算法:
基於內容content-based的推薦,在內容分發平台中,利用使用者畫像中的使用者-分類興趣和分類-應用的矩陣向量進行乘法操作,得出應用打分排名進行推薦,用於解決應用的冷啟動和使用者行為資料稀疏問題。這種方式問題在於,對於物品對應分模擬重需要人工的來進行指定,存在人為方面的因素,很難把控,在推薦的精度方面存在問題。
人工對應於的分類進行標註,難免有缺陷,對應用的內容主題相似度建模,為使用者推薦和之前有過行為的應用的主題相似的應用。
在內容推薦中,還有一種是對應用進行打標籤tag,結合使用者畫像中的標籤,通過內容的匹配演算法,推薦應用給使用者。
基於協同過濾的推薦,為了增加應用推薦的新穎性,利用使用者的歷史行為資料,進行基於item的協同過濾推薦,該推薦演算法需要離線計算item之間的相似度,對於使用者行為的稀疏性問題,採用jaccard來計算物品的相似度,同時需要考慮規避活躍使用者的影響。
基於關聯規則的推薦,利用並行fpgrowth來計算應用之間的相關性。
推薦系統的架構
離線部分,基於使用者特徵(畫像分類興趣、標籤、行為特徵)和應用庫(類別、標籤,每個應用都可以用類別和標籤來特徵化),利用機器學習、文字挖掘、統計以及相關的推薦演算法進行離線模型(使用者特徵表、特徵物品表、融合模型)計算,比如利用lda進行應用的內容主題抽取以做主題相似度的比較;基於item的協同過濾,需要根據使用者的行為,計算物品之間的相似度;以及針對各種演算法的融合模型的訓練等等。這些處理過程一般都可以採用分布式的並行處理過程mr來進行離線的計算。
在推薦過程中,除了在不同的場景用不同的演算法進行融合外,也需要考慮商業的目標,運營業務希望通過人工規則來干預推薦的結果,比如商業推廣。這就需要設定規則來進行干預。
設計乙個推薦系統,需要演算法、資料、產品方面都需綜合考慮,利用演算法和資料得出模型並應用於推薦,推薦的結果展示以及對最終的效果的反饋也需要良好的產品設計來支撐,以提高人機互動的能力,提高推薦的效果。
內容分發平台個性化推薦系統經驗簡單總結
推薦在電商和網際網路應用中已經應用的非常廣泛,相比於根據query進行主動的搜尋,推薦是更加被動的由系統自動推出商品給使用者。搜尋的意圖比較明顯,直接由query給出,而推薦需要計算猜測使用者的意圖,根據使用者歷史資料和當前行為,基於各種模型推薦合適的商品,提公升使用者體驗,提高轉化率。不過近些年來...
個性化推薦系統
基於協同過濾的推薦大體包括 基於專案的協同過濾 item basedcf 基於使用者的協同過濾 user basedcf 基於模型的協同過濾演算法 1 3 基於專案的協同過濾 item basedcf 首先根據不同使用者歷史購買商品的評分資訊計算出各專案之間的相似度,構建各專案之間的相似度矩陣 再找...
推薦系統概述 個性化推薦
1.從乙個例子出發 兩名使用者都在某電商 購買了a b兩種產品。當他們產生購買這個動作的時候,兩名使用者之間的相似度便被計算了出來。其中一名使用者除了購買了產品a和b,還購買了c產品,此時推薦系統會根據兩名使用者之間的相似度會為另一名使用者推薦專案c。2.應用現狀 推薦系統可以說是無處不在了,比如 ...