推薦引擎利用特殊的資訊過濾(if,information filtering)技術,將不同的內容(例如電影、**、書籍、新聞、、網頁等)推薦給可能感興趣的使用者。通常情況下,推薦引擎的實現是通過將使用者的個人喜好與特定的參考特徵進行比較,並試圖**使用者對一些未評分專案的喜好程度。參考特徵的選取可能是從專案本身的資訊中提取的,或是基於使用者所在的社會或社團環境。
根據如何抽取參考特徵,我們可以將推薦引擎分為以下四大類:
基於mahout的電影推薦系統:
apache mahout 是 apache software foundation(asf) 旗下的乙個開源專案,提供一些可擴充套件的機器學習領域經典演算法的實現,旨在幫助開發人員更加方便快捷地建立智慧型應用程式。經典演算法包括聚類、分類、協同過濾、進化程式設計等等,並且,在 mahout 中還加入了對apache hadoop的支援,使這些演算法可以更高效的執行在雲計算環境中。
1)基於內容的推薦
2)協同過濾演算法
僅僅基於使用者行為資料設計的推薦演算法,稱為協同過濾演算法。此方法主要根據使用者對物品的歷史行為,尋找使用者或物品的近鄰集合,以此計算使用者對物品的偏好。
a) 基於領域的模型演算法
i) 基於使用者的協同過濾演算法(usercf)
這種演算法給使用者推薦和他興趣相似的其他使用者喜歡的物品。
計算使用者興趣相似度時,要避免熱門物品自帶馬太效應的影響。換句話說,兩個使用者對冷門物品採取過同樣行為,更能說明他們的興趣相似。
ii) 基於物品的協同過濾演算法(itemcf)
這種演算法給使用者推薦和他之前喜歡的物品相似的物品。該演算法是目前業界應用最多的演算法。
b) 隱語義模型演算法
lfm(latent factor model)隱語義模型是最近幾年推薦系統領域最熱門的話題,它的核心思想是通過隱含特徵聯絡使用者興趣和物品。
基於機器學習,可以優化指標建立最優模型。
c) 基於圖的模型
3)基於關聯規則的推薦 主要用於購物車分析
4)基於知識推薦
5)混合推薦
推薦系統 筆記
什麼是推薦系統 一種資訊過濾系統,使用者對物品的評分和偏好 推薦系統的問題模式 行為 80 直接 行為本身發生的概率 物品的相對排序 利用隱式反饋資料 隱式反饋的發生概率 問題 思維模式 目標思維和不確定性思維 使用者畫像和物品畫像 要用物品和使用者的文字資訊構建出乙個基礎版本的使用者畫像 內容分類...
推薦系統 筆記(下)
因為標籤的特點,它很適合用到推薦系統中。標籤和使用者 物品類似,它的流行度分布也滿足長尾分布。考慮到標籤後,使用者的標籤行為資料可以表示為 u i,b 表示使用者 u 給物品 i 打了個標籤 b 對於評測指標,如果實際的標籤可以視作為使用者的正反饋,那麼準確率和召回率中的 t u 表示測試集上使用者...
推薦系統提綱筆記
問題本質 矩陣的未知部分如何填充問題 已知的值是使用者已經互動過的 item,如何基於這些已知值填充矩陣剩下的未知值,也就是去 使用者沒有互動過的 item 是矩陣填充要解決的問題。缺點 mf 模型 矩陣分解 fism factored item similarity model svd 缺點 優點...