推薦系統筆記一 簡介和評估

2021-09-10 02:55:13 字數 987 閱讀 4437

搜尋和推薦的區別:搜尋更關注馬太效應(馬太效應傳送門),簡單的說,就是讓富有者更加富有,讓貧窮者更加貧窮;而對於推薦來說,則更加關注長尾分布,也就是要要提高覆蓋率;

如何得知推薦系統推薦的好壞,分為 …

對於推薦系統有兩個必須考慮的問題:ee(exploit-explore)和冷啟動問題:其中之一的解決辦法便是使用bandit演算法,有比較好的博文對此進行了總結,給個傳送門(bandit演算法),為什麼bandit演算法可以在一定程度上緩解冷啟動問題呢?模擬下面這個場景,對於乙個新來的使用者,並不確定他的興趣如何,那麼我們可以通過分類或者lda等生成topic的方式,將此作為多臂***,我們可以通過若干次實驗,確定使用者對於不同topic的感興趣概率;比如推薦某乙個topic給使用者,如果有顯示或者隱式反饋,表示得到了喜歡,否則表示使用者不喜歡,那麼多次實驗以後,就能完善對於該使用者的推薦了。

其實bandit演算法解決的便是如何權衡多樣性和準確性的問題,其起源於多臂***問題,選擇哪個***可以做到最大化收益呢?最好的辦法是去試一試,不是盲目地試,而是有策略地快速試一試,這些策略就是bandit演算法。常用的bandit演算法:

冷啟動問題:

一)提供非個性化的推薦:比如熱門排行榜。等使用者行為資料收集到一定時候再切換為個性化推薦。

二)利用註冊資訊,比如提供的年齡,性別等做粗粒化的推薦。

三)利用使用者社交網路賬號登入。

四)要求使用者在註冊時對一些物品進行反饋,收集使用者興趣資訊。

五)對新加的物品,利用內容資訊,將他們推薦給喜歡過和他們內容類似的使用者。(lda、tf-idf、word2vec等)

六)系統冷啟動時,可引入專家知識,通過一定高效方式迅速建立物品的相關度表。

《推薦系統 技術 評估及高效演算法》一2 1 簡介

推薦系統典型地運用了其他相鄰領域的技術和方法,如人機互動和資訊檢索。但是,大多數系統的核心演算法都可以理解成資料探勘技術的乙個特例。資料探勘的過程一般由三個連續執行的步驟組成 資料預處理 59 資料分析和結果解釋 見圖2.1 我們將在2.2節中分析一些最重要的資料預處理方法。鑑於資料抽樣 資料降維 ...

推薦系統 常見評估指標 學習筆記

目錄 1 推薦系統簡介 2 推薦系統常見評估指標 2.1 使用者滿意度 2.2 準確率相關 2.3 覆蓋率 2.4 多樣性 2.5 新穎性 2.6 roc auc 1.what 使用者 推薦系統是一種幫助使用者快速發現有用資訊的工具 公司 推薦系統是一種增加公司產品與使用者接觸,購買等行為概率的工具...

推薦演算法 推薦系統的評估

其中 ep 是測試資料集合 rs ua i ualu lu u 待推薦的列表大小 離線測試,使用者 u在測試集中影片數量 未打分的影片數量 iu a 是 影片 a 在使用者推薦列表中的排名ap x i 1x pre dict ioni ch ange inre call i ap 2 p redi ...