推薦系統的核心問題是為使用者推薦與其興趣相似度比較高的商品。此時需要乙個函式f(x)來計算候選商品與使用者之間的相似度,並向使用者推薦相似度比較高的商品。為了能夠**出函式f(x),可以利用的歷史資料主要有:使用者的歷史行為資料、與該使用者相關的其他使用者資訊、商品之間的相似性、文字的描述等等。
其中,r是乙個全體的排序集合,對於每乙個使用者c∈c,希望從商品的集合中選擇出商品,即s∈s,以使得應用函式f的值最大。
協同過濾演算法是最基本的推薦演算法,cf演算法從使用者的歷史行為資料中挖掘出使用者的興趣,為使用者推薦其感興趣的項。根據挖掘方法的不同,協同過濾演算法可以分為基於使用者的協同過濾演算法和基於項的協同過濾演算法。
基於使用者的協同過濾演算法是基於乙個這樣的假設:跟你喜好相似的人喜歡的東西你也很有可能喜歡。所以基於使用者的協同過濾的主要任務是找出使用者的最近鄰居,從而根據最近鄰居的喜好做出未知項的評分**。
使用者評分:可以分為顯性評分和隱性評分兩種。顯性評分就是直接給專案評分,隱性評分就是通過評價或者購買的行為給專案評分。
這種演算法存在效能上的瓶頸,當使用者數越來越多的時候,尋找最近鄰居的複雜度也會大幅度增加。因而這種演算法不能滿足即時推薦的要求,基於項的協同過濾就解決了這一問題。
未完待續
機器學習演算法 11 推薦系統實戰
from numpy import from numpy import linalg as la 載入資料 使用者 菜餚矩陣 行為 使用者,列為希餚,表示使用者對某個菜餚的評分 def loadexdata2 return 0,0,0,0,0,4,0,0,0,0,5 0,0,0,3,0,4,0,0,...
機器學習資料推薦
4 pattern recognition and machine learning bishop 700頁 大名鼎鼎的機器學習教材,現在沒有中文版。2008版本,所以文中的內容很有時代性和系統性 7 discrete stochastic processes draft of 2nd editio...
機器學習 提供推薦
計算兩個人的相似度 本來是推薦平均評分較高的作品,考慮到兩個人的愛好相似程度,對評分根據相似度進行加權平均 計算相似度 歐幾里得距離 pearson相關度 critics gene seymour michael phillips claudia puig mick lasalle jack mat...