1.reader = tf.textlinereader(),每次讀取一行
閱讀器的read
方法會輸出乙個key來表徵輸入的檔案和其中的紀錄(對於除錯非常有用),同時得到乙個字串標量, 這個字串標量可以被乙個或多個解析器,或者轉換操作將其解碼為張量並且構造成為樣本。
file1.csv內容
10010
1112
0101
1011120
10210
1112
0103
1011120
10410
1112
0105
1011120
10610
1112
0file0.csv內容110
111202
10 111203
1011120
410111205
1011120
610111207
1011120
import tensorflow as tf
filename_queue = tf.train.string_input_producer(["file0.csv", "file1.csv"])
reader = tf.textlinereader()
key, value = reader.read(filename_queue)
# default values, in case of empty columns. also specifies the type of the
# decoded result.
record_defaults = [[1], [1], [1], [1], [1]]
col1, col2, col3, col4, col5 = tf.decode_csv(
value, record_defaults=record_defaults)
#features = tf.concat(0, [col1, col2, col3, col4])
features = [col1, col2, col3, col4]
with tf.session() as sess:
# start populating the filename queue.
coord = tf.train.coordinator()
threads = tf.train.start_queue_runners(coord=coord)
for i in range(1200):
# retrieve a single instance:
example, label = sess.run([features, col5])
print(example,label)
coord.request_stop()
coord.join(threads)
輸出結果
[1, 10, 11, 12] 0
[2, 10, 11, 12] 0
[3, 10, 11, 12] 0
[4, 10, 11, 12] 0
[5, 10, 11, 12] 0
[6, 10, 11, 12] 0
[7, 10, 11, 12] 0
[100, 10, 11, 12] 0
[101, 10, 11, 12] 0
[102, 10, 11, 12] 0
[103, 10, 11, 12] 0
[104, 10, 11, 12] 0
[105, 10, 11, 12] 0
[106, 10, 11, 12] 0
[100, 10, 11, 12] 0
[101, 10, 11, 12] 0
[102, 10, 11, 12] 0
[103, 10, 11, 12] 0
[104, 10, 11, 12] 0
[105, 10, 11, 12] 0
[106, 10, 11, 12] 0
[1, 10, 11, 12] 0
[2, 10, 11, 12] 0
可以看出乙個檔案的內容是按順序讀的,沒有打亂。
2.固定長度記錄
從二進位制檔案中讀取固定長度紀錄, 可以使用tf.fixedlengthrecordreader
的tf.decode_raw
操作。decode_raw
操作可以講乙個字串轉換為乙個uint8的張量。
tensorflow資料載入器
自己看的 import numpy as np import os from pil import image import random os.environ tf cpp min log level 2 train file data train test file data test clas...
Tensorflow之資料的載入
載入資料 tensorflow作為符號程式設計框架,需要先構建資料流圖,再讀取資料,隨後在進行模型的訓練,所以其官網給出了三種載入資料的方式 1 預載入資料 x1 tf.constant 2,3,4 x2 tf.constant 4,0,1 y tf.add x1,x2 這種方法的缺點在於,將資料直...
tensorflow2的資料載入
對於一些小型常用的資料集,tensorflow有相關的api可以呼叫 keras.datasets 經典資料集 1 boston housing 波士頓房價 2 mnist fasion mnist 手寫數字集 時髦品集 3 cifar10 100 物象分類 4 imdb 電影評價 使用 tf.da...