ucl機器學習知識庫:包括近300個不同大小和型別的資料集,可用於分類、回歸、聚類和推薦系統任務。資料集列表位於:
amazon aws公開資料集:包含的通常是大型資料集,可通過amazon s3訪問。這些資料集包括人類基因組專案、common crawl網頁語料庫、維基百科資料和google booksngrams。相關資訊可參見:
kdnuggets:這裡包含乙個詳細的公開資料集列表,其中一些上面提到過的。該列表位於:
機器學習資料集 Dataset 彙總
cifar 10包含10個類別,50,000個訓練影象,彩色影象大小 32x32,10,000個測試影象。類別 airplane,automobile,bird,cat,deer,dog,frog,horse,ship,truck 資料格式 python版本 matlab版本 二進位制版本 cifa...
機器學習iris資料集匯入
iris資料集在模式識別研究領域應該是最知名的資料集了,有很多文章都用到這個資料集。這個資料集裡一共包括150行記錄,其中前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用於識別鳶尾花的屬性,第5列為鳶尾花的類別 包括setosa,versicolour,virginica三類 也即通過判定花萼...
機器學習資料集 Dataset 彙總
cifar 10包含10個類別,50,000個訓練影象,彩色影象大小 32x32,10,000個測試影象。類別 airplane,automobile,bird,cat,deer,dog,frog,horse,ship,truck 資料格式 python版本 matlab版本 二進位制版本 cifa...