推薦系統資料集

2021-08-10 19:41:47 字數 1000 閱讀 7505

movielens dataset:

其中movielens-100k和movielens-1m有使用者對電影的打分,電影的title、genre、imdb鏈結、使用者的gender、age、occupation、zip code。movielens-10m中還有使用者對電影使用的tag資訊。
hetrec2011 dataset:包括了movielens-2k、delicious-2k和last.fm-2k。

在movielens-2k中,電影的資訊更加豐富了,有imdb和rotten tomatoes的資訊,具體還有電影對應的genre、director、actor、發行的國家、拍攝的地點、tag資訊,當然還有打分資訊。

在delicious-2k中,是使用者對bookmark(書籤)的tag資訊。具體包括使用者之間的relation、書籤的title和url、使用者對書籤使用的tag。這個資料集適用於tag的推薦。

在last.fm-2k中,是使用者收聽**的資訊。具體包括雙向的朋友關係、藝術家、使用者收聽藝術家資訊(有weight)、使用者對藝術家的tag資訊、藝術家tag資訊。

wikilens dataset

bookcrossing dataset: 使用者對書的打分資訊,使用者城市、使用者年齡、書在amazon的資訊及url。

jest joker dataset

eachmovie dataset

(下圖摘自**recommender system survey)

flixster dataset: 使用者對電影的打分以及使用者的friendship資訊。

yelp dataset:

bibsonomy dataset: 與delicious類似。

foursquare dataset:location-based 推薦。

epinions and ciao dataset:

另外還有一些社交網路分析的資料集

推薦系統常用資料集

ps 對原文有所刪減 在這篇部落格中,作者介紹了九個資料集,其中一些是推薦系統中常用到的標準資料集,也有一些是非傳統意義上的資料集 non traditional datasets 作者相信,這些非傳統資料集更接近真實場景的資料。movielens資料集由grouplens研究組在 universi...

推薦系統常用資料集

book 1.book crossing bookcrossing bx 資料集由cai nicolas花了的4周 2004年8月 9月 從book crossing社群中爬取得到的。電子商務 2.amazon 3.retailrocket推薦系統資料集 該資料集由三個檔案組成 乙個行為資料集 ev...

MovieLens推薦系統資料集官方文件 解釋

grouplens research已從movielens 收集並提供評級資料集。根據集合的大小,在不同的時間段收集資料集。在使用這些資料集之前,請檢視其readme檔案以獲取使用許可證和其他詳細資訊。幫助我們的研究實驗室 請對movielens資料集進行簡短的調查 穩定的基準資料集。138,000...