提取 BSD TAR 檔案

無限制 作業。檔案大小可達 2.5GB。免費,永遠免費。

完全本地化

我們的轉換器在您的瀏覽器中運行,所以我們從未看到您的數據。

超快速度

不需要上傳您的檔案到伺服器—轉換馬上開始。

安全為先

與其他轉換器不同,您的檔案從未上傳到我們。

什麼是 BSD TAR 格式?

BSD tar

BSD TAR(磁帶存檔)格式是一種廣泛使用的檔案格式,用於存檔和壓縮檔案和目錄的集合。它最初是為將資料備份到磁帶等順序存取裝置而開發的,但現在通常用於分發軟體套件和在各種儲存媒體上建立備份存檔。TAR 格式允許將多個檔案打包到單一存檔檔案中,同時保留目錄結構、檔案屬性和權限。

TAR 存檔包含一系列檔案標頭和檔案資料區塊,這些區塊串聯在一起。存檔中的每個檔案都由一個 512 位元組的標頭區塊表示,後跟檔案的資料,該資料填充到 512 位元組的倍數。標頭區塊包含有關檔案的元資料,例如其名稱、大小、擁有權、權限和修改時間戳記。

檔案標頭區塊具有固定結構,其中包含預定義大小的欄位。一些關鍵欄位包括:

- 檔案名稱(100 位元組):檔案的名稱,通常限制為 255 個字元,以空位元組終止。

- 檔案模式(8 位元組):檔案的權限和類型,儲存為八進位數字。

- 擁有者的使用者 ID(8 位元組):檔案擁有者的數字使用者 ID。

- 群組的使用者 ID(8 位元組):檔案擁有者的數字群組 ID。

- 檔案大小(12 位元組):檔案的大小(以位元組為單位),儲存為八進位數字。

- 修改時間(12 位元組):檔案最後修改的時間戳記,儲存為自 1970 年 1 月 1 日以來的秒數(八進位)。

- 標頭檢查碼(8 位元組):標頭區塊的檢查碼,用於偵測損毀。

在標頭區塊之後,檔案的資料儲存在連續的 512 位元組區塊中。如果檔案大小不是 512 位元組的倍數,則最後一個區塊會以空位元組填充。存檔的結尾標記為兩個連續的 512 位元組區塊,其中填滿了空位元組。

原始 TAR 格式的限制之一是它不支援大於 8 GB 的檔案大小,因為檔案大小欄位只有 12 位元組。為了克服這個限制,後來的擴充功能(例如 POSIX.1-2001 (pax) 格式)引入了額外的標頭欄位來支援更大的檔案大小。

TAR 格式本身不提供資料壓縮。然而,使用 gzip、bzip2 或 xz 等壓縮演算法來壓縮 TAR 存檔是很常見的做法。產生的檔案通常會給予 .tar.gz、.tgz、.tar.bz2、.tbz2、.tar.xz 或 .txz 等副檔名,以表示所使用的壓縮方法。

建立和解壓縮 TAR 存檔受到大多數作業系統的支援,可以使用命令列工具或圖形使用者介面來執行。在類 Unix 系統上,通常使用 tar 指令。例如:

- 建立 TAR 存檔:`tar -cf archive.tar file1 file2 directory/`

- 解壓縮 TAR 存檔:`tar -xf archive.tar`

- 建立壓縮的 TAR 存檔:`tar -czf archive.tar.gz file1 file2 directory/`

除了基本的 TAR 格式之外,還有許多變體和擴充功能,例如 GNU TAR 格式,它增加了對稀疏檔案、長檔名和延伸屬性的支援。這些擴充功能提供了額外的功能,同時與基本的 TAR 格式保持相容性。

TAR 格式的簡潔性和可移植性促成了它在不同平台和使用案例中的廣泛採用。它仍然是存檔、備份和軟體分發的熱門選擇,通常與壓縮方法結合使用,以減少儲存需求和傳輸時間。

檔案壓縮透過減少冗餘,讓相同的資訊佔用更少的位元。可壓縮的上限受資訊理論約束:對於無失真壓縮,上界是信源熵(參見香農的信源編碼定理以及他於 1948 年發表的《通信的數學理論》)。對於有失真壓縮,碼率與感知品質之間的權衡由率失真理論描述。

兩大支柱:建模與編碼

多數壓縮器分兩個階段。首先,模型會預測或揭露資料中的結構。接著,編碼器把這些預測轉成近乎最優的位元型態。經典的建模家族是 Lempel–Ziv:LZ77 (1977)及 LZ78 (1978) 會偵測重複子字串並輸出參照而非原始位元組。編碼面則由霍夫曼編碼(見原始論文1952)為較常出現的符號分配更短的碼字。算術編碼範圍編碼再進一步逼近熵極限,而現代的非對稱數值系統(ANS)則用查表方式取得相似壓縮率。

常見格式怎麼做

DEFLATE(被 gzipzlibZIP 採用)把 LZ77 和霍夫曼編碼結合。其規格完全公開:DEFLATERFC 1951、zlib 封裝RFC 1950以及 gzip 檔案格式RFC 1952。Gzip 針對串流設計並明確不提供隨機存取。PNG 影像則把 DEFLATE 規範為唯一的壓縮方式(視窗最多 32 KiB),詳見 PNG 規格「Compression method 0… deflate/inflate… at most 32768 bytes」W3C/ISO PNG 第二版

Zstandard (zstd): 針對高壓縮率與極快解壓而設計的通用壓縮器。格式記載於RFC 8878(以及HTML 鏡像)和 GitHub 上的參考規格文件。與 gzip 類似,基本框架並不追求隨機存取。zstd 的絕招是字典:從語料擷取的小樣本能大幅改善許多小型或相似檔案的壓縮(參閱python-zstandard 字典文件Nigel Tao 的示例)。各實作同時支援「非結構化」與「結構化」字典(討論)

Brotli: 為網頁內容(如 WOFF2 字體、HTTP)優化,結合靜態字典與類 DEFLATE 的 LZ+熵編碼核心。規格載於RFC 7932,文件同時指出滑動視窗為 2WBITS-16,WBITS 介於 [10, 24](1 KiB-16 B 至 16 MiB-16 B),並且不嘗試隨機存取。Brotli 常在網頁文字上優於 gzip,解碼也相當快速。

ZIP 容器: ZIP 是一種檔案封存格式,可存放使用多種壓縮法(deflate、store、zstd 等)的項目。權威規格是 PKWARE 的 APPNOTE(參見APPNOTE 入口托管副本以及美國國會圖書館的概覽ZIP File Format (PKWARE)/ZIP 6.3.3)。

常見問題解答

什麼是檔案壓縮?

檔案壓縮是一個減少檔案或檔案群大小的過程,通常用於節省儲存空間或加速網路傳輸。

檔案壓縮是如何運作的?

檔案壓縮運作原理,透過識別並移除數據中的冗餘資訊。它使用演算法將原始數據編碼在較小的空間裡。

檔案壓縮有什麼類型?

兩種主要的檔案壓縮類型是無失真及有失真壓縮。無失真壓縮可以完美地恢復原始檔案,然而有失真壓縮在一些資料品質的損失下能得到更大的壓縮程度。

請給出一個檔案壓縮工具的範例?

一個常見的檔案壓縮工具範例是WinZip,它支援多種壓縮格式包括ZIP與RAR。

檔案壓縮會影響檔案質量嗎?

在無失真壓縮中,質量保持不變。然而,在有失真壓縮中,可能會有顯著的質量下降,因為它刪除了一些較不重要的數據以便更大程度地減少檔案大小。

檔案壓縮安全嗎?

是的,相對於資料的完整性來說,檔案壓縮是安全的,尤其是無失真壓縮。然而,如同所有檔案,被壓縮的檔案也可能受到惡意軟體或病毒的攻擊,所以總是需要有專業的安全軟體以保護。

什麼類型的檔案可以壓縮?

幾乎所有種類的檔案都可以被壓縮,包括文字檔案、圖像、音訊、視頻和軟體檔案。然而,壓縮程度可以因檔案類型而有顯著的不同。

什麼是ZIP檔?

ZIP檔是一種使用無失真壓縮以減少一個或多個檔案大小的檔案格式。在ZIP檔中的多個檔案被有效地打包為單一的檔案,這也讓分享變得更加容易。

我可以壓縮一個已經壓縮過的檔案嗎?

技術上可行,儘管額外的大小減少可能非常小或甚至適得其反。壓縮一個已經壓縮過的檔案有時可能會增加其大小,原因在於壓縮演算法所增加的metadata。

我該如何解壓壓縮的檔案?

解壓壓縮的檔案,通常需要一個解壓縮或解zip的工具,像是WinZip或7-Zip。這些工具可以从壓縮格式中提取原始檔案。