movielens dataset:
其中movielens-100k和movielens-1m有使用者對電影的打分,電影的title、genre、imdb鏈結、使用者的gender、age、occupation、zip code。movielens-10m中還有使用者對電影使用的tag資訊。
hetrec2011 dataset:包括了movielens-2k、delicious-2k和last.fm-2k。
wikilens dataset在movielens-2k中,電影的資訊更加豐富了,有imdb和rotten tomatoes的資訊,具體還有電影對應的genre、director、actor、發行的國家、拍攝的地點、tag資訊,當然還有打分資訊。
在delicious-2k中,是使用者對bookmark(書籤)的tag資訊。具體包括使用者之間的relation、書籤的title和url、使用者對書籤使用的tag。這個資料集適用於tag的推薦。
在last.fm-2k中,是使用者收聽**的資訊。具體包括雙向的朋友關係、藝術家、使用者收聽藝術家資訊(有weight)、使用者對藝術家的tag資訊、藝術家tag資訊。
bookcrossing dataset: 使用者對書的打分資訊,使用者城市、使用者年齡、書在amazon的資訊及url。
jest joker dataset
eachmovie dataset
(下圖摘自**recommender system survey)
flixster dataset: 使用者對電影的打分以及使用者的friendship資訊。
yelp dataset:
bibsonomy dataset: 與delicious類似。
foursquare dataset:location-based 推薦。
epinions and ciao dataset:
另外還有一些社交網路分析的資料集
推薦系統常用資料集
ps 對原文有所刪減 在這篇部落格中,作者介紹了九個資料集,其中一些是推薦系統中常用到的標準資料集,也有一些是非傳統意義上的資料集 non traditional datasets 作者相信,這些非傳統資料集更接近真實場景的資料。movielens資料集由grouplens研究組在 universi...
推薦系統常用資料集
book 1.book crossing bookcrossing bx 資料集由cai nicolas花了的4周 2004年8月 9月 從book crossing社群中爬取得到的。電子商務 2.amazon 3.retailrocket推薦系統資料集 該資料集由三個檔案組成 乙個行為資料集 ev...
MovieLens推薦系統資料集官方文件 解釋
grouplens research已從movielens 收集並提供評級資料集。根據集合的大小,在不同的時間段收集資料集。在使用這些資料集之前,請檢視其readme檔案以獲取使用許可證和其他詳細資訊。幫助我們的研究實驗室 請對movielens資料集進行簡短的調查 穩定的基準資料集。138,000...