提取 TARBZ2 文件

无限制 作业。文件大小达到 2.5GB。永久免费。

私密和安全

一切都在您的浏览器中进行。您的文件绝不接触我们的服务器。

极速

无需上传,无需等待。在您拖放文件的瞬间即可转换。

完全免费

无需帐户。无隐藏费用。无文件大小限制花招。

什么是TARBZ2格式?

TAR BZ2

USTAR(Unix 标准磁带存档)是一种用于在 Unix 和类 Unix 操作系统上存档和分发文件的文件格式。它于 20 世纪 80 年代作为一种标准化方法引入,用于创建可以在不同 Unix 系统之间轻松交换的磁带存档。从那时起,USTAR 格式已成为在各种平台上打包和分发软件、数据和其他文件的广泛使用的标准。

USTAR 格式是对早期 TAR(磁带存档)格式的扩展,该格式用于在磁带上创建存档文件。TAR 格式允许将多个文件合并到一个存档文件中,从而更轻松地存储和传输大量文件。然而,原始 TAR 格式存在限制,例如最大文件名长度为 99 个字符,最大文件大小为 8 GB。

为了解决这些限制,USTAR 格式被开发为对原始 TAR 格式的改进。USTAR 格式引入了多项增强功能,包括支持更长的文件名(最多 255 个字符)、更大的文件大小(最多 8 EB 或 8 艾字节)以及用于存储文件属性和权限的其他元数据字段。

USTAR 存档文件由一系列文件记录组成,每个记录代表存档中存储的文件或目录。每个文件记录由一个头和实际文件数据组成。头包含有关文件元数据,例如其名称、大小、所有权、权限和修改时间。文件数据紧随其后,并存储为连续的字节块。

USTAR 头具有 512 字节的固定大小,并分为多个字段。头中的一些重要字段包括:

1. 文件名:一个以空字符结尾的字符串,包含文件或目录的名称,最长 255 个字符。

2. 文件模式:一个 12 个字符的八进制数字,表示文件的权限和模式位。

3. 所有者和组 ID:与文件关联的数字用户和组 ID。

4. 文件大小:一个 12 个字符的八进制数字,表示文件的大小(以字节为单位)。

5. 修改时间:一个 12 个字符的八进制数字,表示文件自 1970 年 1 月 1 日以来的最后修改时间(以秒为单位)。

6. 头校验和:一个 8 个字符的八进制数字,用于错误检测。

USTAR 格式还包括对特殊文件类型(例如符号链接、硬链接和设备文件)的支持。这些特殊文件使用特定的头字段表示,并在提取期间以不同的方式处理。

在创建 USTAR 存档时,存档实用程序(例如 `tar` 命令)读取指定的文件和目录,为每个文件生成适当的头,并将头和文件数据连接到一个存档文件中。可以使用各种压缩算法(例如 gzip 或 bzip2)对生成的存档文件进行压缩,以减小其大小。

要从 USTAR 存档中提取文件,提取实用程序按顺序读取存档文件,解析头以获取有关每个文件的信息。然后,它根据存储在头中的元数据创建必要的文件和目录,并将文件数据写入适当的位置。

USTAR 格式已被广泛采用,并得到不同操作系统上的各种存档和压缩工具的支持。它提供了一种标准化且可移植的方式来打包和分发文件,确保兼容性和易用性。

然而,值得注意的是,USTAR 格式有一些限制。例如,它不支持文件名长度超过 255 个字符或文件大小超过 8 EB。此外,它缺乏内置加密或完整性验证功能,这对于安全的文件传输和存储可能是必需的。

尽管存在这些限制,但 USTAR 格式仍然是存档和分发文件的流行选择,因为它简单、得到广泛支持,并且与各种 Unix 和类 Unix 操作系统兼容。

总之,USTAR 存档格式是对 TAR 格式的扩展,它提供了一种在 Unix 和类 Unix 系统上打包和分发文件的标准化方式。与原始 TAR 格式相比,它支持更长的文件名、更大的文件大小和更多的元数据。USTAR 存档由一系列文件记录组成,每个记录都包含一个带有文件元数据和实际文件数据的头。该格式得到存档和压缩工具的广泛支持,并通常用于软件分发和数据交换。

文件压缩通过减少冗余,让相同的信息占用更少的比特。可压缩的上限受信息论约束:对于无损压缩,上界是信源熵(参见香农的信源编码定理及其 1948 年的原始论文《通信的数学理论》)。对于有损压缩,码率与感知质量之间的权衡由率失真理论描述。

两大支柱:建模与编码

大多数压缩器分两步。首先,模型预测或揭示数据中的结构。然后,编码器把这些预测变成近乎最优的比特模式。一个经典的建模家族是 Lempel–Ziv:LZ77 (1977)和 LZ78 (1978) 会检测重复子串并输出引用而不是原始字节。在编码端,霍夫曼编码(见原始论文1952)会为更常见的符号分配更短的代码。算术编码范围编码能更贴近熵极限,而现代的非对称数值系统(ANS)用查表实现获得相似的压缩率。

常见格式的实际做法

DEFLATE(被 gzipzlibZIP 采用)结合了 LZ77 和霍夫曼编码。其规范完全公开:DEFLATERFC 1951、zlib 封装RFC 1950以及 gzip 文件格式RFC 1952。Gzip 面向流式传输并明确不提供随机访问。PNG 图像标准化将 DEFLATE 作为唯一的压缩方法(窗口最多 32 KiB),可见 PNG 规范“Compression method 0… deflate/inflate… at most 32768 bytes”W3C/ISO PNG 第二版

Zstandard (zstd): 面向高压缩率与快速解压的通用压缩器。格式记录在RFC 8878(还有HTML 镜像)以及 GitHub 上的参考规范文档。与 gzip 类似,基本帧不追求随机访问。zstd 的拿手好戏是字典:从语料中抽取的小样本能显著改善大量小文件或相似文件的压缩(参见python-zstandard 字典文档Nigel Tao 的示例)。各实现同时支持“无结构”和“有结构”字典(讨论)

Brotli: 为网页内容(例如 WOFF2 字体、HTTP)优化,混合静态字典与类似 DEFLATE 的 LZ+熵编码核心。规范见RFC 7932,其中也指出滑动窗口大小为 2WBITS-16,WBITS 取值 [10, 24](1 KiB-16 B 到 16 MiB-16 B),并且不尝试随机访问。Brotli 常在网页文本上优于 gzip,同时保持快速解码。

ZIP 容器: ZIP 是一种文件归档格式,可存储使用多种压缩算法(deflate、store、zstd 等)的条目。事实标准是 PKWARE 的 APPNOTE(参见APPNOTE 门户托管副本以及美国国会图书馆的概览ZIP File Format (PKWARE)/ZIP 6.3.3)。

常见问题解答

什么是文件压缩?

文件压缩是一种减小文件或文件集大小的过程,通常用于节省存储空间或加速网络传输。

文件压缩是如何工作的?

文件压缩通过识别和删除数据中的冗余来工作。它使用算法在更小的空间中编码原始数据。

文件压缩有哪些类型?

文件压缩的两种主要类型是无损压缩和有损压缩。无损压缩允许完美恢复原始文件,而有损压缩则以损失部分数据质量为代价,实现更大的大小减小。

文件压缩工具的例子是什么?

文件压缩工具的一个流行例子是WinZip,它支持包括ZIP和RAR在内的多种压缩格式。

文件压缩会影响文件的质量吗?

对于无损压缩,质量保持不变。然而,对于有损压缩,由于它消除了较不重要的数据以更大程度地减小文件大小,因此可能会有明显的质量下降。

文件压缩安全吗?

是的,就数据完整性而言,文件压缩是安全的,尤其是无损压缩。然而,像任何文件一样,压缩的文件可能会被恶意软件或病毒攻击,因此总是必要的有安装可靠的安全软件。

哪些类型的文件可以被压缩?

几乎所有类型的文件都可以被压缩,包括文本文件、图像、音频、视频和软件文件。然而,可达到的压缩水平可以在文件类型之间大大变化。

ZIP文件是什么意思?

ZIP文件是一种使用无损压缩来减小一个或多个文件大小的文件格式。ZIP文件中的多个文件有效地被捆绑在一起成为一个单一的文件,这也使得分享变得更容易。

我可以压缩一个已经压缩的文件吗?

技术上,是的,尽管额外的减小大小可能是微不足道的甚至适得其反。压缩一个已经压缩的文件有时可能会增加它的大小,由于压缩算法添加的元数据。

我如何解压文件?

要解压文件,你通常需要一个解压或解压缩工具,如WinZip或7-Zip。这些工具可以从压缩格式提取原始文件。