提取 PAX 文件

无限制 作业。文件大小达到 2.5GB。永久免费。

私密和安全

一切都在您的浏览器中进行。您的文件绝不接触我们的服务器。

极速

无需上传,无需等待。在您拖放文件的瞬间即可转换。

完全免费

无需帐户。无隐藏费用。无文件大小限制花招。

什么是PAX格式?

便携式归档交换

PAXR(便携式存档交换修订版)存档格式是一种通用且高效的文件压缩和打包标准,旨在实现跨平台兼容性和数据完整性。该格式由 PAXR 联盟(一个由数据存储和压缩行业领导者组成的团体)开发,旨在解决现有存档格式的局限性,同时为现代计算环境提供高级功能。

PAXR 的核心采用无损压缩算法的组合,包括 LZMA2、Brotli 和 Zstandard,以实现高压缩比,同时不牺牲数据完整性。该格式支持多个压缩级别,允许用户根据其特定需求平衡压缩速度和文件大小缩减。PAXR 还引入了一种称为 DynamicOpt 的新颖自适应压缩技术,该技术分析输入数据并为每个文件选择最合适的压缩算法和设置,从而实现最佳压缩性能。

PAXR 格式的关键特性之一是其强大的错误检测和纠正功能。PAXR 实施了一个多层错误检查系统,其中包括针对各个文件的 CRC32 校验和针对整个存档的 SHA-256 哈希。这确保了在传输和存储期间保持数据完整性,并允许检测和纠正由数据损坏或存储介质降级引起的错误。

PAXR 支持广泛的文件属性,包括文件权限、时间戳和扩展元数据。该格式利用灵活且可扩展的属性系统,允许包含由用户或应用程序定义的自定义元数据字段。这使 PAXR 能够满足各个行业和用例的需求,例如科学研究、数字保存和多媒体分发。

PAXR 格式还引入了一项称为 StreamingExtract 的新功能,该功能可以在无需解压缩整个存档的情况下从存档中高效提取各个文件。这是通过智能文件索引和部分解压缩技术相结合来实现的。StreamingExtract 显着提高了大型存档中随机文件访问的性能,使其特别适用于需要频繁访问特定文件的应用程序,例如游戏资产打包和软件分发。

安全性是 PAXR 格式的另一个关键方面。PAXR 支持强大的加密算法,例如 AES-256 和 ChaCha20,以保护敏感数据免遭未经授权的访问。该格式采用灵活的加密方案,允许加密各个文件、目录或整个存档。PAXR 还支持多个加密密钥和密钥管理系统,从而实现细粒度的访问控制和多个用户之间的安全协作。

互操作性是 PAXR 格式的一个关键目标。PAXR 联盟为各种编程语言(包括 C++、Java、Python 和 JavaScript)开发了一组标准化 API 和库。这些 API 为开发人员提供了轻松访问 PAXR 功能的途径,并确保在不同平台和实现中保持一致的行为。该联盟还维护一份全面的规范文档并进行定期互操作性测试,以确保不同的 PAXR 实现可以无缝交换存档。

为了促进采用和向后兼容性,PAXR 格式包括一个兼容性层,允许其包含和提取来自其他流行存档格式(例如 ZIP、RAR 和 TAR)的文件。这使用户能够将现有存档迁移到 PAXR,而不会丢失对旧数据的访问。当遇到不受支持或损坏的数据时,兼容性层还允许 PAXR 实现回退到备用压缩算法,从而增强格式的弹性和可靠性。

总之,PAXR 存档格式代表了数据压缩和打包技术的一项重大进步。凭借其先进的压缩算法、强大的错误检测和纠正、灵活的元数据支持和强大的安全功能,PAXR 非常适合广泛的应用程序,从个人数据备份到大型数据分发和保存。随着该格式的不断发展和采用,它有望成为数据归档和压缩领域的新标准。

文件压缩通过减少冗余,让相同的信息占用更少的比特。可压缩的上限受信息论约束:对于无损压缩,上界是信源熵(参见香农的信源编码定理及其 1948 年的原始论文《通信的数学理论》)。对于有损压缩,码率与感知质量之间的权衡由率失真理论描述。

两大支柱:建模与编码

大多数压缩器分两步。首先,模型预测或揭示数据中的结构。然后,编码器把这些预测变成近乎最优的比特模式。一个经典的建模家族是 Lempel–Ziv:LZ77 (1977)和 LZ78 (1978) 会检测重复子串并输出引用而不是原始字节。在编码端,霍夫曼编码(见原始论文1952)会为更常见的符号分配更短的代码。算术编码范围编码能更贴近熵极限,而现代的非对称数值系统(ANS)用查表实现获得相似的压缩率。

常见格式的实际做法

DEFLATE(被 gzipzlibZIP 采用)结合了 LZ77 和霍夫曼编码。其规范完全公开:DEFLATERFC 1951、zlib 封装RFC 1950以及 gzip 文件格式RFC 1952。Gzip 面向流式传输并明确不提供随机访问。PNG 图像标准化将 DEFLATE 作为唯一的压缩方法(窗口最多 32 KiB),可见 PNG 规范“Compression method 0… deflate/inflate… at most 32768 bytes”W3C/ISO PNG 第二版

Zstandard (zstd): 面向高压缩率与快速解压的通用压缩器。格式记录在RFC 8878(还有HTML 镜像)以及 GitHub 上的参考规范文档。与 gzip 类似,基本帧不追求随机访问。zstd 的拿手好戏是字典:从语料中抽取的小样本能显著改善大量小文件或相似文件的压缩(参见python-zstandard 字典文档Nigel Tao 的示例)。各实现同时支持“无结构”和“有结构”字典(讨论)

Brotli: 为网页内容(例如 WOFF2 字体、HTTP)优化,混合静态字典与类似 DEFLATE 的 LZ+熵编码核心。规范见RFC 7932,其中也指出滑动窗口大小为 2WBITS-16,WBITS 取值 [10, 24](1 KiB-16 B 到 16 MiB-16 B),并且不尝试随机访问。Brotli 常在网页文本上优于 gzip,同时保持快速解码。

ZIP 容器: ZIP 是一种文件归档格式,可存储使用多种压缩算法(deflate、store、zstd 等)的条目。事实标准是 PKWARE 的 APPNOTE(参见APPNOTE 门户托管副本以及美国国会图书馆的概览ZIP File Format (PKWARE)/ZIP 6.3.3)。

常见问题解答

什么是文件压缩?

文件压缩是一种减小文件或文件集大小的过程,通常用于节省存储空间或加速网络传输。

文件压缩是如何工作的?

文件压缩通过识别和删除数据中的冗余来工作。它使用算法在更小的空间中编码原始数据。

文件压缩有哪些类型?

文件压缩的两种主要类型是无损压缩和有损压缩。无损压缩允许完美恢复原始文件,而有损压缩则以损失部分数据质量为代价,实现更大的大小减小。

文件压缩工具的例子是什么?

文件压缩工具的一个流行例子是WinZip,它支持包括ZIP和RAR在内的多种压缩格式。

文件压缩会影响文件的质量吗?

对于无损压缩,质量保持不变。然而,对于有损压缩,由于它消除了较不重要的数据以更大程度地减小文件大小,因此可能会有明显的质量下降。

文件压缩安全吗?

是的,就数据完整性而言,文件压缩是安全的,尤其是无损压缩。然而,像任何文件一样,压缩的文件可能会被恶意软件或病毒攻击,因此总是必要的有安装可靠的安全软件。

哪些类型的文件可以被压缩?

几乎所有类型的文件都可以被压缩,包括文本文件、图像、音频、视频和软件文件。然而,可达到的压缩水平可以在文件类型之间大大变化。

ZIP文件是什么意思?

ZIP文件是一种使用无损压缩来减小一个或多个文件大小的文件格式。ZIP文件中的多个文件有效地被捆绑在一起成为一个单一的文件,这也使得分享变得更容易。

我可以压缩一个已经压缩的文件吗?

技术上,是的,尽管额外的减小大小可能是微不足道的甚至适得其反。压缩一个已经压缩的文件有时可能会增加它的大小,由于压缩算法添加的元数据。

我如何解压文件?

要解压文件,你通常需要一个解压或解压缩工具,如WinZip或7-Zip。这些工具可以从压缩格式提取原始文件。