mnist資料集包含了6w張作為訓練資料,1w作為測試資料。在mnist資料集中,每一張都代表了0~9中的乙個數字,的大小都是28×28,且數字都會出現在的正中間。
資料集包含了四個檔案
t10k-images-idx3-ubyte.gz
測試資料
t10k-labels-idx1-ubyte.gz
測試資料答案
train-images-idx3-ubyte.gz
訓練資料
train-labels-idx1-ubyte.gz
訓練數答案
每張的784個畫素點組成長度為784的一維陣列,作為輸入特徵
[0. 0. 0. ...... 0.38 0.45 0.64 .... 0. 0. 0. ]
的標籤以乙個一維陣列的形式給出,每個元素表示對應分類出現的概率,比如數字「6」的標籤
[0. 0. 0. 0. 0. 0. 1. 0. 0. 0. ]
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('./data/',one_hot=true)
print("train data size:",mnist.train.num_examples)
print("validation data size:",mnist.validation.num_examples)
print("test data size:",mnist.test.num_examples)
t_lables0 = mnist.train.labels[1] #返回標籤
t_iamge0 = mnist.train.images[1] #返回資料
t_iamge0.resize(28,28) #將784個元素的標籤轉換為28*28
print('t_lables0: ',t_lables0) #檢視標籤
執行結果:
extracting ./data/train-images-idx3-ubyte.gz檢視t_iamge0,如下圖extracting ./data/train-labels-idx1-ubyte.gz
extracting ./data/t10k-images-idx3-ubyte.gz
extracting ./data/t10k-labels-idx1-ubyte.gz
train data size: 55000
validation data size: 5000
test data size: 10000
t_lables0: [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]
通過檢視到的標籤,可以看出,存放的就是手寫數字「3」
MNIST資料集介紹
大多數示例使用手寫數字的mnist資料集 1 該資料集包含60,000個用於訓練的示例和10,000個用於測試的示例。這些數字已經過尺寸標準化並位於影象中心,影象是固定大小 28x28畫素 其值為0到1。為簡單起見,每個影象都被平展並轉換為784 28 28 個特徵的一維numpy陣列。在我們的示例...
Mnist資料集簡介
1,基本概念 mnist是乙個非常有名的手寫體數字識別資料集,在很多資料中,這個資料集都會被用作深度學習的入門樣例。而tensorflow的封裝讓使用mnist資料集變得更加方便。mnist資料集是nist資料集的乙個子集,mnist 資料集可在 獲取,它包含了四個部分 1 training set...
載入 MNIST 資料集
使用 tensorflow 來讀取資料及標籤 from tensorflow.examples.tutorials.mnist import input data import tensorflow as tf 載入資料集 mnist input data.read data sets e soft...