原文出處:
import os
import struct
import numpy as np
import matplotlib.pyplot as plt
mnist 資料集可在 獲取, 它包含了四個部分:
training set images: train-images-idx3-ubyte.gz (9.9 mb, 解壓後 47 mb, 包含 60,000 個樣本)
training set labels: train-labels-idx1-ubyte.gz (29 kb, 解壓後 60 kb, 包含 60,000 個標籤)
test set images: t10k-images-idx3-ubyte.gz (1.6 mb, 解壓後 7.8 mb, 包含 10,000 個樣本)
test set labels: t10k-labels-idx1-ubyte.gz (5kb, 解壓後 10 kb, 包含 10,000 個標籤)
return images, labels#返回陣列
(train_img,train_lab)=load_mnist('d:\minist\data',kind='train')
print(train_img.shape)
print(train_lab.shape)
fig, ax = plt.subplots(
nrows=2,
ncols=5,
sharex=true,
sharey=true, )
ax = ax.flatten()
for i in range(10):
img = train_img[i].reshape(28, 28)
ax[i].imshow(img, cmap='greys', interpolation='nearest')
ax[0].set_xticks()
ax[0].set_yticks()
plt.tight_layout()
plt.show()
資料處理 流資料處理利器
流處理 stream processing 是一種計算機程式設計正規化,其允許給定乙個資料序列 流處理資料來源 一系列資料操作 函式 被應用到流中的每個元素。同時流處理工具可以顯著提高程式設計師的開發效率,允許他們編寫有效 乾淨和簡潔的 流資料處理在我們的日常工作中非常常見,舉個例子,我們在業務開發...
爬蟲 資料處理 pandas資料處理
使用duplicated 函式檢測重複的行,返回元素為布林型別的series物件,每個元素對應一行,如果該行不是第一次出現,則元素為true keep引數 指定保留哪一重複的行資料 dataframe替換操作 使用df.std 函式可以求得dataframe物件每一列的標準差 資料清洗清洗重複值 清...
MNIST資料集的處理
1 mnist資料集介紹 資料格式介紹 2 資料讀取 mnist資料集的讀取比較複雜,這裡給出兩種讀取方式。2.1 struct包讀取資料 nn網路中使用的讀取方法 2.2 torch.version和torch.utils.data.dataloader處理資料 import torch from...