Extrahieren Sie PAX

Unbegrenzt Aufträge. Dateigrößen bis zu 2.5GB. Kostenlos, für immer.

Alles lokal

Unser Konverter läuft in Ihrem Browser, daher sehen wir Ihre Daten nie.

Blitzschnell

Kein Hochladen Ihrer Dateien auf einen Server - Konvertierungen starten sofort.

Standardmäßig sicher

Im Gegensatz zu anderen Konvertern werden Ihre Dateien nie auf unseren Server hochgeladen.

Was ist das PAX Format?

Portable Archiv eXchange

PAX (Pre-Allocate eXtension) ist ein Open-Source-Format für komprimierte Archive, das von Microsoft als moderne Alternative zu bestehenden Formaten wie ZIP, RAR und tar entwickelt wurde. Es wurde entwickelt, um die Einschränkungen bestehender Formate zu beheben und die Komprimierung, Leistung, Sicherheit und Funktionalität der Archivierung auf modernen Systemen und Geräten zu verbessern.

Zu den wichtigsten Unterscheidungsmerkmalen des PAX-Formats gehören eine verbesserte Komprimierung mit modernen Algorithmen, ein effizienter Direktzugriff auf Dateien in Archiven, native Unterstützung für Multithreading, erweiterbare Metadaten, integrierte Verschlüsselung und Integritätsprüfung sowie eine dokumentierte offene Spezifikation, um eine breite Akzeptanz und Interoperabilität zu fördern.

PAX-Archive verwenden die Dateierweiterung .pax und haben eine mehrteilige interne Struktur, die aus einem Header, einem zentralen Verzeichnis, komprimierten Datenblöcken und einem Footer besteht. Dadurch können wichtige Informationen wie der Archivinhalt, Komprimierungsparameter und Integritäts-Hashes getrennt von den eigentlichen komprimierten Dateidaten gespeichert werden.

Der PAX-Header beginnt mit einer 4-Byte-Magischen Zahl (50 41 58 00 in Hex) zur Identifizierung. Er enthält dann Felder für die PAX-Version, die Komprimierungsmethode, die Verschlüsselungsmethode, die Hash-Methode, die Blockgröße, die Anzahl der parallelen Komprimierungsthreads und verschiedene Flags. Der Header endet mit erweiterbaren XML-Metadaten, die Details zum Archiv liefern.

Dem Header folgt das zentrale PAX-Verzeichnis. Dieses enthält einen Eintrag für jede komprimierte Datei/jeden komprimierten Ordner im Archiv und speichert den vollständigen Pfad, Attribute, Größen, Block-Offsets und Hashes. Dies an einem Ort zu haben, ermöglicht eine effiziente Auflistung des Archivinhalts und einen Direktzugriff auf einzelne Dateien, ohne komprimierte Daten zu scannen.

Der Großteil eines PAX-Archivs besteht aus einer Reihe komprimierter Datenblöcke. Jeder Block hat einen kleinen Header, der die unkomprimierte und komprimierte Größe angibt, gefolgt von einem Teil der Dateidaten, die mit dem konfigurierten Algorithmus komprimiert wurden. Blöcke haben standardmäßig eine Größe von 1 MB, dies kann jedoch im Archivheader angepasst werden.

Komprimierte Datenblöcke werden optional verschlüsselt, wenn eine Verschlüsselungsmethode angegeben ist. PAX unterstützt moderne Verschlüsselungsschemata wie AES-256. Das Archivkennwort wird verwendet, um einen Schlüssel abzuleiten, der jeden Block unabhängig verschlüsselt und so einen effizienten Direktzugriff ermöglicht. Zur Authentifizierung hasht PAX Passwörter mit einem sicheren KDF.

Zur Komprimierung unterstützt PAX eine Vielzahl moderner Allzweck-Codecs, die für eine schnelle Dekomprimierung optimiert sind: LZMA, LZ4, Brotli, Zstandard usw. Es ermöglicht auch Präprozessoren zur weiteren Größenreduzierung bei bestimmten Dateitypen (z. B. Delta-Codierung bei EXEs/DLLs, E8E9-Codierung bei x86-Code). Codecs und Präprozessoren werden in einer Pipeline angewendet.

Um eine effiziente Multithread-Komprimierung zu ermöglichen, werden Dateien in unabhängig komprimierte Blöcke partitioniert, die von parallelen Codec-Instanzen verarbeitet werden können. Der PAX-Kompressor skaliert automatisch, um alle verfügbaren CPU-Kerne zu nutzen. Eine ähnliche Partitionierung ermöglicht eine parallele Dekomprimierung für eine schnellere Extraktion.

PAX bietet Datenintegrität und Manipulationsschutz, indem Hashes der Original- und komprimierten Daten gespeichert werden. Archive enthalten einen Header-Hash, um eine Kürzung zu erkennen. Das zentrale Verzeichnis wird ebenfalls gehasht, um eine Manipulation von Dateimetadaten zu verhindern. Bitfäule in komprimierten Daten wird durch das Hashing jedes Blocks erkannt.

Am Ende eines PAX-Archivs befindet sich der Footer. Dieser enthält eine Kopie der Header-Felder, den Offset/die Größe des zentralen Verzeichnisses und einen Hash für das gesamte Archiv. Der Footer hat eine feste Größe und befindet sich immer am Ende der Datei, was eine einfache Lokalisierung und Verifizierung von PAX-Archiven ermöglicht.

PAX-Archive können effizient aktualisiert werden, indem das zentrale Verzeichnis geändert und geänderte Datenblöcke angehängt werden, anstatt ganze Archive wie ZIP neu zu schreiben. Ganze Dateien können eingefügt, entfernt oder ersetzt werden, indem Metadaten aktualisiert und die relevanten Blöcke hinzugefügt/entfernt werden. Archive können auch schnell angehängt werden.

Um Zip-Slip-Schwachstellen zu minimieren, erfordert PAX explizite Pfade (kein ../-Traversal) und verhindert das Schreiben außerhalb des Extraktionsstamms. Lange ZIP-Metadatenfelder, die Denial-of-Service ermöglichten, sind eingeschränkt. Komprimierungsbomben werden durch Grenzwerte für das Komprimierungsverhältnis und die Speichernutzung entschärft.

Dateizeitstempel in PAX-Archiven verwenden ein standardmäßiges 64-Bit-Format, das einen großen Datumsbereich mit einer Genauigkeit von 1 Sekunde abdeckt. Attribute für POSIX-Berechtigungen und Windows-ACLs werden unterstützt. PAX kann alternative NTFS-Datenströme und Ressourcen-Forks speichern. Auch Symlinks und Hardlinks sind darstellbar.

Das Open-Source-PAX-SDK bietet einfache APIs zum programmatischen Erstellen, Extrahieren, Aktualisieren und Überprüfen von PAX-Archiven. Es kümmert sich um alle Low-Level-Details des PAX-Formats. Das SDK ist in mehreren Sprachen verfügbar, darunter C, C++, C#, Java, Python, JavaScript, Go und Rust.

Zusammenfassend lässt sich sagen, dass das PAX-Archivformat auf dem Fundament bewährter Formate wie ZIP aufbaut und gleichzeitig moderne Funktionen und Optimierungen einführt - effiziente Komprimierung, Multithreading, Direktzugriff, Sicherheit und eine offene Spezifikation. Dies macht PAX ideal für eine Vielzahl von Archivierungsszenarien auf heutigen Systemen.

Die Dateikomprimierung ist ein Prozess, der die Größe von Datendateien für eine effiziente Speicherung oder Übertragung reduziert. Sie verwendet verschiedene Algorithmen zur Datenkondensierung durch Identifizierung und Eliminierung von Redundanzen, was oft die Größe der Daten erheblich verkleinern kann, ohne die ursprünglichen Informationen zu verlieren.

Es gibt zwei Hauptarten der Dateikomprimierung: verlustfrei und verlustbehaftet. Verlustfreie Komprimierung ermöglicht die vollständige Rekonstruktion der Originaldaten aus den komprimierten Daten, was ideal für Dateien ist, bei denen jedes Bit an Daten wichtig ist, wie Text- oder Datenbankdateien. Häufige Beispiele schließen ZIP- und RAR-Dateiformate ein. Andererseits eliminiert verlustbehaftete Komprimierung weniger wichtige Daten, um die Dateigröße stärker zu reduzieren, was oft bei Audio-, Video- und Bilddateien verwendet wird. JPEGs und MP3s sind Beispiele, bei denen ein gewisser Datenverlust die perzeptuelle Qualität des Inhalts nicht wesentlich beeinträchtigt.

Dateikomprimierung ist in vielerlei Hinsicht vorteilhaft. Sie spart Speicherplatz auf Geräten und Servern, senkt die Kosten und verbessert die Effizienz. Sie beschleunigt auch die Dateiübertragungszeiten über Netzwerke, einschließlich des Internets, was besonders wertvoll für große Dateien ist. Darüber hinaus können komprimierte Dateien in einer Archivdatei zusammengefasst werden, was die Organisation und den einfacheren Transport mehrerer Dateien unterstützt.

Dennoch hat die Dateikomprimierung auch einige Nachteile. Der Komprimierungs- und Dekomprimierungsprozess benötigt Rechenressourcen, was die Systemleistung verlangsamen könnte, insbesondere bei größeren Dateien. Außerdem gehen bei der verlustbehafteten Komprimierung einige Originaldaten verloren, und die resultierende Qualität ist möglicherweise nicht für alle Verwendungen akzeptabel, insbesondere für professionelle Anwendungen, die hohe Qualität erfordern.

Die Dateikomprimierung ist ein entscheidendes Werkzeug in der heutigen digitalen Welt. Sie steigert die Effizienz, spart Speicherplatz und verringert Download- und Upload-Zeiten. Dennoch hat sie ihre eigenen Nachteile in Bezug auf die Systemleistung und das Risiko einer Qualitätsdegradation. Daher ist es wichtig, diese Faktoren zu berücksichtigen, um die richtige Komprimierungstechnik für spezifische Datenanforderungen zu wählen.

Häufig gestellte Fragen

Was ist Dateikompression?

Dateikompression ist ein Prozess, der die Größe einer Datei oder Dateien reduziert, normalerweise um Speicherplatz zu sparen oder die Übertragung über ein Netzwerk zu beschleunigen.

Wie funktioniert die Dateikompression?

Die Dateikompression funktioniert, indem sie Redundanzen in den Daten identifiziert und entfernt. Sie verwendet Algorithmen, um die ursprünglichen Daten in einem kleineren Raum zu kodieren.

Was sind die verschiedenen Arten der Dateikompression?

Die beiden primären Arten der Dateikompression sind verlustfreie und verlustbehaftete Kompression. Verlustfreie Kompression ermöglicht die perfekte Wiederherstellung der Originaldatei, während verlustbehaftete Kompression eine größere Größenreduktion ermöglicht, dies jedoch auf Kosten eines Qualitätsverlusts bei den Daten.

Was ist ein Beispiel für ein Werkzeug zur Dateikompression?

Ein populäres Beispiel für ein Dateikompressionstool ist WinZip, das mehrere Kompressionsformate unterstützt, darunter ZIP und RAR.

Beeinträchtigt die Dateikompression die Qualität der Dateien?

Bei verlustfreier Kompression bleibt die Qualität unverändert. Bei verlustbehafteter Kompression kann es jedoch zu einem spürbaren Qualitätsverlust kommen, da weniger wichtige Daten zur Reduzierung der Dateigröße stärker eliminieren werden.

Ist die Dateikompression sicher?

Ja, die Dateikompression ist sicher in Bezug auf die Datenintegrität, insbesondere bei der verlustfreien Kompression. Wie alle Dateien können jedoch auch komprimierte Dateien von Malware oder Viren angegriffen werden. Daher ist es immer wichtig, eine seriöse Sicherheitssoftware zu haben.

Welche Arten von Dateien können komprimiert werden?

Fast alle Arten von Dateien können komprimiert werden, einschließlich Textdateien, Bilder, Audio, Video und Softwaredateien. Das erreichbare Kompressionsniveau kann jedoch zwischen den Dateitypen erheblich variieren.

Was ist eine ZIP-Datei?

Eine ZIP-Datei ist ein Dateiformat, das verlustfreie Kompression verwendet, um die Größe einer oder mehrerer Dateien zu reduzieren. Mehrere Dateien in einer ZIP-Datei werden effektiv zu einer einzigen Datei gebündelt, was das Teilen einfacher macht.

Kann ich eine bereits komprimierte Datei komprimieren?

Technisch ja, obwohl die zusätzliche Größenreduktion minimal oder sogar kontraproduktiv sein könnte. Das Komprimieren einer bereits komprimierten Datei kann manchmal deren Größe erhöhen, aufgrund der durch den Kompressionsalgorithmus hinzugefügten Metadaten.

Wie kann ich eine Datei dekomprimieren?

Um eine Datei zu dekomprimieren, benötigen Sie in der Regel ein Dekompressions- oder Entzip-Tool, wie WinZip oder 7-Zip. Diese Tools können die Originaldateien aus dem komprimierten Format extrahieren.