mnist資料處理

2021-09-29 05:18:04 字數 1023 閱讀 4727

原文出處:

import os

import struct

import numpy as np

import matplotlib.pyplot as plt

mnist 資料集可在 獲取, 它包含了四個部分:

training set images: train-images-idx3-ubyte.gz (9.9 mb, 解壓後 47 mb, 包含 60,000 個樣本)

training set labels: train-labels-idx1-ubyte.gz (29 kb, 解壓後 60 kb, 包含 60,000 個標籤)

test set images: t10k-images-idx3-ubyte.gz (1.6 mb, 解壓後 7.8 mb, 包含 10,000 個樣本)

test set labels: t10k-labels-idx1-ubyte.gz (5kb, 解壓後 10 kb, 包含 10,000 個標籤)

return images, labels#返回陣列

(train_img,train_lab)=load_mnist('d:\minist\data',kind='train') 

print(train_img.shape)

print(train_lab.shape)

fig, ax = plt.subplots(

nrows=2,

ncols=5,

sharex=true,

sharey=true, )

ax = ax.flatten()

for i in range(10):

img = train_img[i].reshape(28, 28)

ax[i].imshow(img, cmap='greys', interpolation='nearest')

ax[0].set_xticks()

ax[0].set_yticks()

plt.tight_layout()

plt.show()

資料處理 流資料處理利器

流處理 stream processing 是一種計算機程式設計正規化,其允許給定乙個資料序列 流處理資料來源 一系列資料操作 函式 被應用到流中的每個元素。同時流處理工具可以顯著提高程式設計師的開發效率,允許他們編寫有效 乾淨和簡潔的 流資料處理在我們的日常工作中非常常見,舉個例子,我們在業務開發...

爬蟲 資料處理 pandas資料處理

使用duplicated 函式檢測重複的行,返回元素為布林型別的series物件,每個元素對應一行,如果該行不是第一次出現,則元素為true keep引數 指定保留哪一重複的行資料 dataframe替換操作 使用df.std 函式可以求得dataframe物件每一列的標準差 資料清洗清洗重複值 清...

MNIST資料集的處理

1 mnist資料集介紹 資料格式介紹 2 資料讀取 mnist資料集的讀取比較複雜,這裡給出兩種讀取方式。2.1 struct包讀取資料 nn網路中使用的讀取方法 2.2 torch.version和torch.utils.data.dataloader處理資料 import torch from...