hdf 是用於儲存和分發科學資料的一種自我描述、多物件檔案格式,是一種儲存相同型別數值的大陣列的機制。hdf 是由美國國家超級計算應用中心(ncsa)建立的,以滿足不同群體的科學家在不同工程專案領域之需要。hdf 可以表示出科學資料儲存和分布的許多必要條件。hdf 被設計為:
乙個hdf5檔案就是乙個由兩種基本資料物件(groups and datasets)存放多種科學資料的容器:
python應用h5py庫實現對hdf5格式的資料檔案(.h5)進行操作。
import h5py #匯入工具包
import numpy as np
#hdf5的寫入:
imgdata = np.zeros((30
,3,128
,256
))
f = h5py.file(
'file.h5'
,'w'
)#建立乙個h5檔案,檔案指標是f
f['data'
]= imgdata #將資料寫入檔案的主鍵data下面
f['labels']=
range
(100
)#將資料寫入檔案的主鍵labels下面
f.close(
)#關閉檔案
#hdf5的讀取:
f = h5py.file(
'file.h5'
,'r'
)#開啟h5檔案
f.keys(
)#可以檢視所有的主鍵
a = f[
'data'][
:]#取出主鍵為data的所有的鍵值
f.close(
)
Matlab建立HDF5資料集 壓縮
建立hdf5資料集必須先後使用h5create h5write命令 h5create官方鏈結 h5write官方鏈結 我創造的資料集大小是256x256x3x50000 每個256x256x3是rgb樣本。如果在matlab裡將rgb三維矩陣存成jpg,大小只有6kb 但是我把三維矩陣存入到hdf5...
Caffe中使用HDF5製作多標籤資料
在caffe中,如果使用lmdb資料格式的話,預設是只支援 影象 整數單標籤 這種形式的資料的。如果訓練網路需要一些其他形式的資料或標籤 如浮點資料,多標籤等等 可以將其製作成hdf5格式。ps hdf5資料格式比較靈活,但缺點是占用空間較大。筆者曾經試著把229多張512x512的影象製作成乙個h...
《Python和HDF 5大資料應用》 導讀
過去的幾年裡,python已經和idl或matlab一樣,成為科學分析領域值得信賴的選擇。它擁有穩健的核心模組,可用於處理數值陣列 numpy 分析 scipy 以及繪圖 matplotlib 同時還擁有十分豐富的專用模組。它能幫助人們減少編寫科學 的工作量,同時還能提高計算結果的質量。本書向所有有...