推薦系統典型地運用了其他相鄰領域的技術和方法,如人機互動和資訊檢索。但是,大多數系統的核心演算法都可以理解成資料探勘技術的乙個特例。
資料探勘的過程一般由三個連續執行的步驟組成:資料預處理[59]、資料分析和結果解釋(見圖2.1)。我們將在2.2節中分析一些最重要的資料預處理方法。鑑於資料抽樣、資料降維、距離函式在推薦系統中的意義及所擔任的重要角色,我們將特別關注這些內容。從2.3節到2.5節,將總體介紹在推薦系統中最常使用的資料探勘方法:分類、聚類、關聯規則發現(圖2.1詳細顯示了本章中包含的不同主題)。
本章不會完整回顧資料探勘方法,而是強調資料探勘演算法在推薦系統領域中的影響,並概述已經成功應用的主要資料探勘技術。感興趣的讀者可以進一步參考資料探勘課本(見[28,73]),或參考貫穿全章的引文。
《推薦系統 技術 評估及高效演算法》一2 6 總結
本章介紹了在設計推薦系統中可能用到的主要的資料探勘方法和技術。我們也總結了在文獻中提到的用法,提供了如何以及在哪用到它們一些粗略指導。我們從綜述在預處理步驟可能用到的技術開始。首先,2.2.1節回顧了如何選擇合適的距離衡量指標。在後面的步驟中大部分的方法需要它。余弦相似度和皮爾遜相關度是一般可接受最...
推薦演算法 推薦系統的評估
其中 ep 是測試資料集合 rs ua i ualu lu u 待推薦的列表大小 離線測試,使用者 u在測試集中影片數量 未打分的影片數量 iu a 是 影片 a 在使用者推薦列表中的排名ap x i 1x pre dict ioni ch ange inre call i ap 2 p redi ...
推薦系統演算法(2)
協同過濾 cf 推薦演算法通過在使用者活動中尋找特定模式來為使用者產生有效推薦。它依賴於系統中使用者的慣用資料,例如通過使用者對其閱讀過書籍的評價可以推斷出使用者的閱讀偏好。這種演算法的核心思想就是 如果兩個使用者對於一些項的評分相似程度較高,那麼乙個使用者對於乙個新項的評分很有可能類似於另乙個使用...