foursquare資料集介紹
該資料集包含2153471個使用者,1143092個場所,1021970個簽到,27098490個社交關係以及使用者分配給場所的2809581評級;所有這些都是通過公共api從foursquare應用程式中提取的。所有使用者資訊均已匿名,即使用者地理位置也已匿名。每個使用者都由乙個id和geospatial位置表示。場地也一樣。資料報含在五個檔案中:users.dat,containers.dat,checkins.dat,socialgraph.dat和rating.dat。以下是有關所有這些檔案的內容和使用的更多詳細資訊。
檔案內容
users.dat:由一組使用者組成,因此每個使用者都有乙個唯一的id和代表使用者家鄉位置的地理空間位置(緯度和經度)。
events.dat:由一組場所(例如,餐館)組成,以便每個場所都有唯一的id和地理空間位置(緯度和經度)。
checkins.dat:標記使用者在場所的簽到(訪問)。每個簽到都具有唯一的id以及使用者id和場所id。
socialgraph.dat:包含使用者之間存在的社交圖邊緣(連線)。每個社交關係由兩個唯一的id(first_user_id和second_user_id)表示的兩個使用者(朋友)組成。
rating.dat:包含隱式評分,用於量化使用者對特定地點的喜歡程度。
鳴謝使用者必須通過引用以下**來承認使用該資料集而在出版物中使用該資料集:
mohamed sarwat, justin j. levandoski, ahmed eldawy, and mohamed f. mokbel.
lars: a scalable and efficient location-aware recommender system. in ieee transactions on knowledge and data engineering tkde
justin j. levandoski, mohamed sarwat, ahmed eldawy, and mohamed f. mokbel. lars: a location-aware recommender system. in icde 2012
Pascal VOC 資料集介紹
介紹pascal voc資料集 資料格式 衡量方式 voc2007,voc2012 有以下幾個task classification 略過 detection 將中所有的目標用bounding box bbox 框出來 segmentation 將中所有的目標分割出來 person layout 略...
Keras 資料集介紹
基本的使用情況差不多介紹的差不多了,我也是邊學習邊寫部落格,其中難免有很多理解錯誤的地方或者理解不到位的地方,還請各位博友多多指點。python view plain copy print?keras.datasets.cifar10 keras.datasets.cifar10cifar10資料集...
MNIST資料集介紹
mnist資料集包含了6w張作為訓練資料,1w作為測試資料。在mnist資料集中,每一張都代表了0 9中的乙個數字,的大小都是28 28,且數字都會出現在的正中間。資料集包含了四個檔案 t10k images idx3 ubyte.gz 測試資料 t10k labels idx1 ubyte.gz ...