Matlab建立HDF5資料集 壓縮

2021-10-01 19:46:20 字數 559 閱讀 7143

建立hdf5資料集必須先後使用h5create h5write命令

h5create官方鏈結

h5write官方鏈結

我創造的資料集大小是256x256x3x50000

每個256x256x3是rgb樣本。

如果在matlab裡將rgb三維矩陣存成jpg,大小只有6kb

但是我把三維矩陣存入到hdf5中,大小竟達到200+kb

全部訪問完大小達到200x50000=10gb,這對於我成萬計的樣本量是萬萬不能接受的。

感謝鏈結的啟發。

可以在h5create中加入壓縮等級(0~9),採用gzip壓縮。

h5create(filename,'/x',[3 256 256 inf],'chunksize',[3 256 256 1],'deflate',8);
這樣單樣本(算上其他附加標籤)的大小就被壓縮至9kb,達到期望大小。

解決完問題後才想起來,其實jpg也是採用了壓縮演算法才會把資料量變小的。如果h5create中未壓縮,將會把樣本中大量255值原封不動存入,自然會導致hdf5檔案大小增大。

matlab建立HDF5檔案

一 例子 1 建立寫入 testdata uint8 magic 5 h5create my example.h5 dataset1 size testdata 建立 h5write my example.h5 dataset1 testdata 寫入 2 檢視 h5disp test.h5 3 讀...

深度學習 資料集 HDF5資料格式

hdf 是用於儲存和分發科學資料的一種自我描述 多物件檔案格式,是一種儲存相同型別數值的大陣列的機制。hdf 是由美國國家超級計算應用中心 ncsa 建立的,以滿足不同群體的科學家在不同工程專案領域之需要。hdf 可以表示出科學資料儲存和分布的許多必要條件。hdf 被設計為 乙個hdf5檔案就是乙個...

安裝HDF5及在VS下配置HDF5

最近要用到hdf5來儲存資料,想要安裝嘗試用一下.發現網上有兩種安裝方式,一種是obtain518.html 獲取最新的hdf5 1.8軟體 另一種是cmakebuild518.html 使用cmake構建hdf5 1.8.我原本嘗試後一種方法 windows下hdf5靜態庫的封裝與測試 已驗證 發...