校招結束休息了快2個多月了,現在開始系統的學習推薦演算法,基於項亮的書
離線實驗的方法:
(1):通過日誌系統獲得使用者行為資料
(2):將資料集分成訓練集和測試集
(3):在訓練集上訓練模型,在測試集上進行測試
(4):通過事先定義的離線指標評測演算法在測試集上的**結果
使用者調查:
顧名思義,但是招募測試使用者的代價較大,很難組織大規模的測試使用者
在完成離線實驗和必要的使用者調查後,可以將推薦系統上線做ab測試,將它和舊的演算法進行比較
1.**準確度
**準確度考慮推薦演算法的**打分與使用者實際打分的相似程度。
平均絕對誤差指標mae(mean absolute error):
平均平方誤差mse:
有乙個電影評價系統,它可以對某一部電影給出其他使用者評價電影的「星」的平均數(就好像豆瓣書評一樣),而且給出對某個使用者的**「星數」。而**準確度就是能夠度量系統中**「星」數與使用者實際給出的「星」數的差別。打分區間為[0,10]
平均絕對誤差mae:
平均平方誤差mse:
標準平均絕對誤差(做標準化):
**準確度
**準確度
優點缺點
為了評估推薦演算法的好壞需要各方面的評估指標。
對使用者u推薦n個物品(記為r(u)),令使用者u在測試集上喜歡的物品集合為t(u)
準確率就是最終的推薦列表中有多少是推薦對了的。描述最終的推薦列表中有多少比例是發生過的使用者-物品評分記錄。
召回率就是推薦對了的佔全集的多少。描述有多少比例的使用者-物品評分記錄包含在最終的推薦列表中。
下圖直觀地描述了準確率和召回率的含義
新穎度新穎度是為了推薦長尾區間的物品。用推薦列表中物品的平均流行度度量推薦結果的新穎度。如果推薦出的物品都很熱門,說明推薦的新穎度較低,否則說明推薦結果比較新穎。
這篇文章可以參考看一下,比我總結的清晰
餐飲收銀系統排名推薦 含詳細測評
移動網際網路 大資料 雲計算等科技化成為餐飲新趨勢,為餐飲行業帶來了新cbkvn玩法和新可能,消費行為大規模向互聯www.cppcns.com網和移動端遷移。越來越多的餐飲公司提供基於網際網路的諸多服務,滿足日益移動化 智慧型化需求的消費場景,對餐飲收銀系統的要求也越來越高。市場上的收銀系統品牌眾多...
學生成績測評系統
1 問題描述 功能要求 1 通過類的知識實現學生成績資訊 學號 姓名 院系 三門課成績 考試平均成績 同學互評分 任課教師評分 綜合測評總分,其中綜合測評總分由 考試平均成績70 同學互評分10 任課教師評分20 2 能夠實現學生成績資訊的儲存和讀取 如果使用資料庫訪問資訊可加分 3 實現所有相關資...
推薦系統架構 推薦系統(1) 業界推薦系統架構
1.1業界主流推薦系統架構 業界推薦系統通用架構 1.2使用者本身資料 1.3物品本身資料 1.4使用者行為資料 2.1基於離線訓練的推薦系統架構設計 常用演算法 邏輯回歸 logistics regression 梯度提公升決策樹 gbdt 和因式分解 fm 架構設計 2.2面向深度學習的推薦系統...