from keras.datasets import mnist
我們用mnist為例,
mnist手寫數字資料庫有60000個示例的訓練集和10000個示例的測試集。數字已被規格化,並在固定大小的影象中居中。
它是乙個很好的資料庫,供那些想嘗試在實際資料上學習技術和模式識別方法,同時在預處理和格式化方面花費最少精力的人使用。
train-images-idx3-ubyte.gz:訓練集影象(9912422位元組)
train-labels-idx1-ubyte.gz:訓練集標籤(28881位元組)
t10k-images-idx3-ubyte.gz:測試集影象(1648877位元組)
t10k-labels-idx1-ubyte.gz:測試集標籤(4542位元組)
我們使用程式
(x_train,y_train),(x_test,y_test) = mnist.load_data()
為了檢視內容,我們列印一下:
print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)
列印結果為:
這充分說明了該資料是由28*28畫素的影象構成,訓練集有60000個,測試集有10000個。
其存放路徑為
c:\users\使用者名稱\.keras\datasets
注意該檔案是隱藏檔案。
Keras 資料集介紹
基本的使用情況差不多介紹的差不多了,我也是邊學習邊寫部落格,其中難免有很多理解錯誤的地方或者理解不到位的地方,還請各位博友多多指點。python view plain copy print?keras.datasets.cifar10 keras.datasets.cifar10cifar10資料集...
keras機器學習基礎
機器學習就是計算機用資料來學習。通過給計算機一些資料,讓計算機來學習,之後能夠進行自主計算和判斷。比如先給計算機一些阿貓阿狗的,並且告訴計算機每張是什麼 也就是標籤 計算機通過這些喂進去的資料來學習。學習完後,計算機就具備自主判斷能力,給計算機一張從未見過的阿貓或者阿狗的,計算機就能夠給打乙個標籤 ...
機器學習學習筆記(一)之資料集
一 學習階段可用的資料集 1 kaggle 特點 大資料競賽平台 真實資料 資料量巨大 2 uci資料集 特點 收錄了500餘個資料集 覆蓋科學 生活 競技領域 資料量幾十萬 3 scikit learn 特點 資料量較小 方便學習 二 scikit learn工具介紹 安裝 pip install...