Linux中gz檔案操作遇到的一些技巧和坑

2022-06-17 09:30:14 字數 656 閱讀 3605

目錄前提是gz檔案超大,如上百g,肯定不能直接解壓來做。

gzip -cd test.gz |head -100

gzip -cd test.gz |tail -100

use perlio::gzip;

open in,"<:gzip>

除了常規的perl模組安裝,還可用conda來直接安裝perlio::gzip模組。

conda install -c bioconda perl-perlio-gzip

#或conda install -c bioconda/label/cf201901 perl-perlio-gzip

平時習慣了直接用wc -l file命令來檢視檔案行數,但用在gz等壓縮檔案中就不行了。雖然它不會報錯,也會返回統計行數,但返回的實際是壓縮檔案的行數(往往比原始檔多很多),而非原始檔。給乙個示例就能明白:

檢視壓縮檔案的命令,只有zcat、less等少數幾個命令,如果要進行其他操作,不要偷懶,先用它們開啟檔案再用管道操作。

Linux中的gz格式壓縮

一 語法 gzip 原始檔 壓縮為.gz格式的壓縮檔案,原始檔會消失 gzip c 原始檔 壓縮檔案 壓縮為.gz格式,原始檔保留 gzip r 目錄 壓縮目下的所有子檔案,但不能壓縮目錄 gzip d 壓縮檔案 解壓縮檔案 gunzip 壓縮檔案 解壓縮檔案 二 實戰 root localhost...

gz檔案上載到hdfs中

gz檔案上載到hdfs中 用 dfs copyformlocal的方式,上載後的檔案正常,可以用mapreduce直接讀取 終於找到原因了 乙個配置問題,ok用flume的方式,datastream型別,上載後mapreduce操作異常,為何呢?設定為hdfs.filetype為sequencefi...

Linux系統中 bz2與 gz檔案的區別

unix下常見的壓縮檔案格式,是由具有高壓縮率的壓縮工具bzip2生成,以後綴為.bz2結尾的壓縮檔案。gz是unix系統中的壓縮檔案,zip的gnu版本,功能和winrar一樣壓縮檔案。bz2和.gz都是linux下壓縮檔案的格式,有點類似windows下的.zip和.rar檔案。bz2和.gz的...