在電腦科學和資訊理論中,資料壓縮或者源編碼是按照特定的編碼機制用比未經編碼少的資料位元(或者其它資訊相關的單位)表示資訊的過程。例如,如果我們將「compression」編碼為「comp」那麼這篇文章可以用較少的資料位表示。常見的例子是zip檔案格式,此格式不僅僅提供壓縮功能,還可作為歸檔工具(archiver),能夠將許多檔案儲存到同乙個檔案中。
簡單的說,就是經過壓縮軟體壓縮的檔案叫壓縮檔案,壓縮的原理是把檔案的二進位制**壓縮,把相鄰的0,1**減少,比如有000000,可以把它變成6個0 的寫法60,來減少該檔案的空間。
壓縮檔案的基本原理是查詢檔案內的重複位元組,並建立乙個相同位元組的"詞典"檔案,並用乙個**表示,比如在檔案裡有幾處有乙個相同的詞"中華人民共和國"用乙個**表示並寫入"詞典"檔案,這樣就可以達到縮小檔案的目的。
gzip是若干種檔案壓縮程式的簡稱,通常指gnu計畫的實現,此處的gzip代表gnu zip。也經常用來表示gzip這種檔案格式。軟體的作者是jean-loup gailly和mark adler。在2023年10月31日第一次公開發布,版本號0.1,2023年2月,發布了1.0版本
bzip2是julian seward開發並按照自由軟體/開源軟體協議發布的資料壓縮演算法及程式。seward在2023年7月第一次公開發布了bzip2 0.15版,在隨後幾年中這個壓縮工具穩定性得到改善並且日漸流行,seward在2023年晚些時候發布了1.0版。
在電腦科學中,7z是一種可以使用多種壓縮演算法進行資料壓縮的檔案格式。該格式最初被7-zip實現並採用,但是這種檔案格式是公有的,並且7-zip軟體本身亦在gnu寬通用公共許可證 (gnu lgpl)協議下開放源**。當前lzma軟體開發工具包的最新版本為v15.12。
rar是一種專利檔案格式,用於資料壓縮與歸檔打包,開發者為尤金·羅謝爾(俄語:евгений лазаревич рошал,拉丁轉寫:yevgeny lazarevich roshal),rar的全名是「roshal archive」,即「羅謝爾的歸檔」之意。首個公開版本rar 1.3發布於2023年。
尤金·羅謝爾,2023年3月10日生於俄羅斯。畢業於俄羅斯車里雅賓斯克工業大學(chelyabinsk technical university,今南烏拉州立大學),也是far檔案管理器的作者。他開發程式壓縮或解壓rar檔案,最初用於dos,後來移植到其它平台。主要的windows版本編碼器,稱為winrar,以共享軟體的形式發行。不過羅謝爾公開了解碼器原始碼,unrar解碼器許可證以不許發布編譯rar相容編碼器為條件下允許有條件自由發布與修改,而rar編碼器一直是有專利的。
最近的開發者是尤金·羅謝爾的胞兄亞歷山卓·羅謝爾。雖然其解碼器有專利,編譯好的解壓程式仍然存在於若干平台,例如開源的7-zip。
檔案字尾名
說明壓縮
解壓縮*.zip
zip 程式打包壓縮的檔案
zip filename.zip dirname
unzip filename.zip
*.rar
rar 程式壓縮的檔案
rar a filename.rar dirname
rar x filename.rar
*.7z
7zip 程式壓縮的檔案
7z a filename.7z dirname
7z x filename.7z
*.tar
tar 程式打包,未壓縮的檔案
tar cvf filename.tar dirname
tar xvf filename.tar
*.gz
gzip 程式 (gnu zip) 壓縮的檔案
gzip filename
gzip -d filename.gz
*.bz2
tar 打包,gzip 程式壓縮的檔案
bzip2 -z filename
bzip2 -d filename.bz2
*.tar.gz
tar打包,gzip程式壓縮的檔案
tar zcvf filename.tar.gz dirname
tar zxvf filename.tar.gz
*.tar.xz
tar打包,xz程式壓縮的檔案
tar cvjf filename.tar.xz dirname
tar -xvjf filename.tar.xz
*.tar.bz2
tar打包,bzip2程式壓縮的檔案
tar jcvf filename.tar.bz2 dirname
tar jxvf filename.tar.bz2
*.zcompress命令解壓縮rar檔案
compress filename
uncompress filename.z
常見壓縮格式
缺點 壓縮格式 工具演算法 副檔名 是否可切分 對應的編碼 解碼器 org.apache.hadoop.io.compress.default 無default delete 否defaultcodec gzip gzip default gz否 gzipcodec bzip2 bzip2 bzip...
Linux 常見壓縮格式解壓縮命令彙總
1.z compress d filename d 解壓縮 2.bz2 bzip2 dz filename bzcat filename 讀取壓縮檔案內容 d 解壓縮 z 壓縮 3.gz gzip d filename zcat filename 讀取壓縮檔案內容 d 解壓縮 壓縮等級,1 9,9最...
常見的壓縮格式
減少儲存磁碟空間 降低io 網路的io和磁碟的io 加快資料在磁碟和網路中的傳輸速度,從而提高系統的處理速度 由於使用資料時,需要先將資料解壓,加重cpu負荷 需要安裝 linux系統下沒有對應的命令d.bzip2 壓縮格式 優點缺點 gzip 壓縮比在四種壓縮方式中較高 hadoop本身支援,在應...