MNIST資料集介紹

2021-09-11 09:27:10 字數 1532 閱讀 7199

mnist資料集包含了6w張作為訓練資料,1w作為測試資料。在mnist資料集中,每一張都代表了0~9中的乙個數字,的大小都是28×28,且數字都會出現在的正中間。

資料集包含了四個檔案

t10k-images-idx3-ubyte.gz

測試資料

t10k-labels-idx1-ubyte.gz

測試資料答案

train-images-idx3-ubyte.gz

訓練資料

train-labels-idx1-ubyte.gz

訓練數答案

每張的784個畫素點組成長度為784的一維陣列,作為輸入特徵

[0. 0. 0.  ......   0.38 0.45 0.64 ....    0. 0. 0. ]

的標籤以乙個一維陣列的形式給出,每個元素表示對應分類出現的概率,比如數字「6」的標籤

[0.  0.  0.  0.  0.  0.  1.  0.  0.  0. ] 

from tensorflow.examples.tutorials.mnist import  input_data

mnist = input_data.read_data_sets('./data/',one_hot=true)

print("train data size:",mnist.train.num_examples)

print("validation data size:",mnist.validation.num_examples)

print("test data size:",mnist.test.num_examples)

t_lables0 = mnist.train.labels[1] #返回標籤

t_iamge0 = mnist.train.images[1] #返回資料

t_iamge0.resize(28,28) #將784個元素的標籤轉換為28*28

print('t_lables0: ',t_lables0) #檢視標籤

執行結果:

extracting ./data/train-images-idx3-ubyte.gz

extracting ./data/train-labels-idx1-ubyte.gz

extracting ./data/t10k-images-idx3-ubyte.gz

extracting ./data/t10k-labels-idx1-ubyte.gz

train data size: 55000

validation data size: 5000

test data size: 10000

t_lables0:  [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]

檢視t_iamge0,如下圖

通過檢視到的標籤,可以看出,存放的就是手寫數字「3」

MNIST資料集介紹

大多數示例使用手寫數字的mnist資料集 1 該資料集包含60,000個用於訓練的示例和10,000個用於測試的示例。這些數字已經過尺寸標準化並位於影象中心,影象是固定大小 28x28畫素 其值為0到1。為簡單起見,每個影象都被平展並轉換為784 28 28 個特徵的一維numpy陣列。在我們的示例...

Mnist資料集簡介

1,基本概念 mnist是乙個非常有名的手寫體數字識別資料集,在很多資料中,這個資料集都會被用作深度學習的入門樣例。而tensorflow的封裝讓使用mnist資料集變得更加方便。mnist資料集是nist資料集的乙個子集,mnist 資料集可在 獲取,它包含了四個部分 1 training set...

載入 MNIST 資料集

使用 tensorflow 來讀取資料及標籤 from tensorflow.examples.tutorials.mnist import input data import tensorflow as tf 載入資料集 mnist input data.read data sets e soft...