推薦系統實踐讀書筆記

2021-10-02 12:49:16 字數 2085 閱讀 4008

最近大概複習了一下這本書,了解了較早的推薦系統的一些方法,記錄如下,以便大家對本書內容有個快速地了解。略去了第一張,詳細的**和細節可以參考其他部落格。需要關注的地方直接標出了頁碼。

書裡面的**不是很完整,用來學習還可以。第八章介紹了一些svd等機器學習的演算法,在2023年的今天可以回顧一下。

推薦系統實踐

第二章:利用使用者行為資料

常見資料集:

book-crossing(有評分、年齡、書籍的簡介等) ,last.fm , netflix prize ,delicious(有標籤) ,citeulike(有標籤),digg, yahoo!music, grouplens, kdd cup.

基於使用者的cf:可以先構造倒排表,然後再計算使用者相似度,這樣能降低計算開銷(p47)。user-iif演算法的表現更好。

基於物品的cf:解釋性強。iuf演算法(1998)降低了活躍使用者對物品相似性的影響,歸一化的物品cf能提高推薦的多樣性。

兩種cf的比較:usercf更加類似社會網路推薦,itemcf更加偏重挖掘某個使用者的愛好。itemcf在覆蓋率方面不如usercf,可以通過p63的方法改進。

隱語義模型:借鑑文字挖掘領域的知識,包括lda\plsa\矩陣分解等。書中介紹了lfm,推導和偽**已經給出。這個方法能極大地提高覆蓋率,在netflix prize比賽中也使用了lfm,第八章進行了詳細介紹。這個方法對冷啟動問題效果不好,需要每天重新訓練計算,雅虎提出了改進(p71)。

基於圖演算法的模型:效果不好,計算慢,大致的思想就是隨機遊走,但是**沒看懂;可以用矩陣論的方法優化(p77)。

第三章:冷啟動第四章:利用標籤資料

用標籤將物品、使用者聯絡起來。本章介紹了推薦多樣性、新穎性、覆蓋率的計算,見p105。接下來仿照tf-idf對簡單的標籤推薦演算法進行了改進,提出了新的解決標籤稀疏的問題。基於圖的標籤演算法也做了介紹。基於標籤可以進行推薦系統的可解釋研究。如何給使用者推薦一些潛在標籤在p115~116做了介紹。

第五章:利用上下文資訊

基於上下文的推薦考慮了使用者的位置、心情、工作環境等資訊。使用者近期的行為偏好更加重要。物品也是有時效性的(新聞、熱播電視劇集)。推薦系統應該具有實時性和時間上的多樣性(能立即作出反饋、不同時間段的推薦結果不同)。基於時間的推薦演算法中,由於資料型別不同,各個演算法的表現也不盡相同,見p139實驗。基於地點位置資訊的推薦,作者介紹了lars,這個系統可以將使用者位置或物品位置納入考量。

第六章:社交網路

社交網路推薦,人們更願意聽從朋友、同事、同學的意見。可以利用使用者之間的關係、同一社群中的使用者兩周手段來進行社會化推薦。本章節介紹了集中利用圖模型來建模的方法,符合社交網路的特點。這種圖方法比較慢,可以參考p154的twitter的訊息佇列方法。edgerank可以進行資訊流推薦。可以使用不同的策略去推薦好友,最重要的就是每個人的重要性和人和人之間的關係(p165)。

第七章:架構

使用者常見特徵:人口統計特徵,使用者行為特徵(瀏覽記錄、收藏等),話題特徵(如喜歡看龍門客棧、葉問,那麼就是「武俠電影」話題)。

推薦系統架構:由使用者特徵抽取模組、初始推薦模組(根據前乙個模組和特徵-物品表生成初始列表)、過濾-排序推薦模組構成。過濾-排序模組需要考慮新穎度、多樣性等指標。

第八章:機器學習方法

前面所有章節都在討論top-n推薦,本節考慮評分**。

p186提出了一種新的相似度計算公式(adjust cosine similarity)可以在其他相似度計算場景中應用。

svd在實際應用中,具有空間開銷大、資料稀疏、計算複雜的問題,因此引入funk-svd演算法該演算法只需要不斷優化兩個矩陣即可實現評分**。biassvd是一種引入了偏置(用來模擬一些無關的擾動)。p191提到的svd++也是一種基於矩陣分解的演算法,**中的z沒有理解。p193題出的時間模型在前面svd模型的基礎上加入了對時間、季節的建模,是09年的acm的工作。

融合方法介紹了兩種,第一種是模型加權融合,先在訓練集合驗證集上學習權重a,然後再把訓練集、驗證集合並為大的訓練集,並使用權重a再去融合。另外一種類似於adaboost,但不是對錯誤樣本進行強化學習。

《推薦系統實踐》讀書筆記4

為什麼要研究系統的時間特性?不同系統有不同的時效性,有的系統物品的時效性很短,熱起來,很快會冷下去 而有的系統物品的時效性長,具有比較長的生命週期。研究系統的時間特性,能增強系統的有效性推薦。比如推薦新聞,會主要選擇最近時間段發生的新聞事件進行推薦 而推薦旅遊景點,時效性較長 有些也有季節性變化 則...

《推薦系統實踐》讀書筆記 推薦系統十戒

1 確定你真的需要推薦系統。推薦系統只有在使用者遇到資訊過載時才有必要。若你的 物品不多,或使用者興趣單一,那麼也許並不需要推薦系統。所以不要糾結於推薦系統這個詞,不要為了推薦系統而做推薦系統,而要從使用者的角度出發,設計出能夠真正幫助使用者發現內容的系統。2 確定商業目標和使用者滿意度之間的關係。...

推薦系統讀書筆記

標籤 空格分隔 演算法 基於內容的推薦 基於知識的推薦 混合推薦方法 主要思想 給定乙個評分資料集和當前 活躍 使用者的id作為輸入,找出與當前使用者過去有相似偏好的其它使用者,這些使用者被稱為對等使用者或最近鄰.物品1物品2 物品3物品4 物品5alice53 44?使用者131 233使用者24...