POSIX ファイルを抽出する

無制限の ジョブ。ファイルサイズは最大 2.5GB。永久に無料。

すべてローカルで実行

コンバーターはブラウザ内で動作するため、データは決して見られません。

超高速

ファイルをサーバにアップロードすることなく、変換は瞬時に開始されます。

デフォルトで安全

他のコンバータとは異なり、ファイルは決してアップロードされません。

POSIX フォーマットとは何ですか?

POSIX

PAX(事前割り当て拡張機能)は、Microsoft が開発したオープンソースの圧縮アーカイブ形式で、ZIP、RAR、tar などの既存の形式の最新の代替手段として設計されました。これは、最新のシステムとデバイスでのアーカイブ処理の圧縮、パフォーマンス、セキュリティ、機能の制限に対処し、改善するために設計されました。

PAX 形式の主な差別化機能には、最新のアルゴリズムを使用した強化された圧縮、アーカイブ内のファイルへの効率的なランダムアクセス、ネイティブのマルチスレッドサポート、拡張可能なメタデータ、組み込みの暗号化と整合性チェック、および広範な採用と相互運用性を促進するための文書化されたオープン仕様が含まれます。

PAX アーカイブはファイル拡張子 .pax を使用し、ヘッダー、中央ディレクトリ、圧縮データブロック、フッターで構成される複数のパーツからなる内部構造を持ちます。これにより、アーカイブの内容、圧縮パラメータ、整合性ハッシュなどの重要な情報を実際の圧縮ファイルデータとは別に格納できます。

PAX ヘッダーは、識別用の 4 バイトのマジックナンバー(16 進数で 50 41 58 00)で始まります。次に、PAX バージョン、圧縮方式、暗号化方式、ハッシュ方式、ブロックサイズ、並列圧縮スレッドの数、およびさまざまなフラグのフィールドが含まれます。ヘッダーは、アーカイブに関する詳細を提供する拡張可能な XML メタデータで終了します。

ヘッダーの後に PAX 中央ディレクトリがあります。これには、アーカイブ内の各圧縮ファイル/フォルダのエントリが含まれ、フルパス、属性、サイズ、ブロックオフセット、ハッシュが格納されます。これを 1 か所に配置することで、アーカイブの内容を効率的にリストし、圧縮データをスキャンすることなく個々のファイルにランダムにアクセスできます。

PAX アーカイブの大部分は、一連の圧縮データブロックです。各ブロックには、未圧縮サイズと圧縮サイズを示す小さなヘッダーがあり、次に構成されたアルゴリズムで圧縮されたファイルデータのチャンクが続きます。ブロックのデフォルトサイズは 1 MB ですが、これはアーカイブヘッダーで調整できます。

暗号化方式が指定されている場合、圧縮データブロックはオプションで暗号化されます。PAX は、AES-256 などの最新の暗号化方式をサポートしています。アーカイブパスワードは、各ブロックを個別に暗号化するキーを派生するために使用され、効率的なランダムアクセスを可能にします。認証のために、PAX は安全な KDF でパスワードをハッシュします。

圧縮のために、PAX は高速な解凍用に最適化されたさまざまな最新の汎用コーデックをサポートしています: LZMA、LZ4、Brotli、Zstandard など。また、特定のファイルタイプ(例: EXE/DLL のデルタエンコーディング、x86 コードの E8E9 エンコーディング)のサイズをさらに削減するためのプリプロセッサも許可します。コーデックとプリプロセッサはパイプラインで適用されます。

効率的なマルチスレッド圧縮を可能にするために、ファイルは並列コーデックインスタンスで処理できる独立して圧縮されたブロックに分割されます。PAX コンプレッサーは、使用可能なすべての CPU コアを使用するように自動的にスケーリングします。同様のパーティション分割により、より高速な抽出のための並列解凍が可能になります。

PAX は、元のデータと圧縮データのハッシュを格納することで、データの整合性と改ざんの検出を提供します。アーカイブには、切り捨てを検出するためのヘッダーハッシュがあります。中央ディレクトリもハッシュ化されて、ファイルメタデータの改ざんを防ぎます。圧縮データのビット腐敗は、各ブロックをハッシュすることで捕捉されます。

PAX アーカイブの最後にはフッターがあります。これには、ヘッダーフィールドのコピー、中央ディレクトリのオフセット/サイズ、およびアーカイブ全体のハッシュが含まれます。フッターは固定サイズで、常にファイルの最後にあり、PAX アーカイブの簡単な場所と検証を可能にします。

PAX アーカイブは、ZIP のようなアーカイブ全体を書き換えるのではなく、中央ディレクトリを変更し、変更されたデータブロックを追加することで効率的に更新できます。メタデータを更新し、関連するブロックを追加/削除することで、ファイル全体を挿入、削除、または置換できます。アーカイブもすばやく追加できます。

zip-slip の脆弱性を軽減するために、PAX は明示的なパス(../ トラバーサルなし)を必要とし、抽出ルートの外への書き込みを防止します。サービス拒否を可能にする長い ZIP メタデータフィールドは制限されています。圧縮率とメモリ使用量の制限により、圧縮爆弾が軽減されます。

PAX アーカイブのファイルタイムスタンプは、1 秒の精度で幅広い日付をカバーする標準の 64 ビット形式を使用します。POSIX パーミッションと Windows ACL の属性がサポートされています。PAX は NTFS 代替データストリームとリソースフォークを格納できます。シンボリックリンクとハードリンクも表現できます。

オープンソースの PAX SDK は、PAX アーカイブをプログラムで作成、抽出、更新、検証するためのシンプルな API を提供します。PAX 形式のすべての低レベルの詳細を処理します。SDK は、C、C++、C#、Java、Python、JavaScript、Go、Rust を含む複数の言語で利用できます。

要約すると、PAX アーカイブ形式は、ZIP などの実績のある形式の基盤の上に構築され、効率的な圧縮、マルチスレッド、ランダムアクセス、セキュリティ、オープン仕様などの最新の機能と最適化を導入しています。これにより、PAX は今日のシステムにおける幅広いアーカイブシナリオに最適です。

ファイルの圧縮は、データファイルのサイズを効率的に保管または送信するために削減するプロセスです。様々なアルゴリズムを使用して、冗長性を特定し、排除することにより、データを圧縮します。これにより、元の情報を失うことなくデータのサイズを大幅に減らすことが可能となります。

ファイル圧縮には二つの主なタイプがあります: ロスレスとロッシー。ロスレス圧縮では、圧縮されたデータから元のデータを完全に再構築することができます。これはテキストやデータベースファイルのように、すべてのビットのデータが重要なファイルに理想的です。一般的な例としてはZIPやRARのファイル形式があります。一方、ロッシー圧縮では、より重要でないデータを排除してファイルサイズをより大幅に削減します。これは音声、映像、画像ファイルによく使用されます。JPEGやMP3は、ある程度のデータロスがコンテンツの知覚品質を大幅に劣化させない例です。

ファイル圧縮は多方面にわたって有益です。デバイスやサーバーのストレージスペースを節約し、コストを抑え、効率を向上させます。また、ネットワークを通じたファイル送信時間を短縮することもできます。これは特に大きなファイルに対して価値があります。さらに、圧縮ファイルは1つのアーカイブファイルにまとめることができ、整理や複数ファイルの輸送が容易になります。

しかし、ファイル圧縮にはいくつかの欠点もあります。圧縮と解凍のプロセスには計算リソースが必要で、特に大きなファイルの場合、システムのパフォーマンスを低下させる可能性があります。また、ロッシー圧縮の場合、一部の元のデータが圧縮時に失われ、結果として生じる品質がすべての用途に対して十分でない場合もあります。特に高品質が求められるプロフェッショナルなアプリケーションなどです。

ファイル圧縮は、今日のデジタルワールドで重要なツールです。それは効率性を向上させ、ストレージスペースを節約し、ダウンロードとアップロードの時間を短縮します。それにもかかわらず、システムパフォーマンスや品質劣化のリスクという自身の問題を抱えています。そのため、これらの要素を考慮に入れて特定のデータニーズに対して適切な圧縮技術を選択することが重要です。

よくある質問

ファイルの圧縮とは何ですか?

ファイルの圧縮は、ファイルやファイルのサイズを減らすプロセスで、通常はストレージスペースを節約したり、ネットワークを介した伝送を高速化するために使用されます。

ファイルの圧縮はどのように機能しますか?

ファイルの圧縮は、データの冗長性を識別して削除することで機能します。それはアルゴリズムを使用して、元のデータをより小さいスペースでエンコードします。

ファイルの圧縮の種類は何ですか?

ファイルの圧縮の主要な2つのタイプはロスレス圧縮とロッシー圧縮です。ロスレス圧縮では、元のファイルを完全に復元することができますが、ロッシー圧縮ではデータ品質の若干の損失を伴うより大きなサイズの削減が可能になります。

ファイルの圧縮ツールの例は何ですか?

ファイルの圧縮ツールの人気の例はWinZipで、ZIPとRARを含む複数の圧縮形式をサポートしています。

ファイルの圧縮はファイルの品質に影響しますか?

ロスレス圧縮では品質は変わりません。しかし、ロッシー圧縮では、それほど重要ではないデータを削除してファイルサイズをより大幅に削減するため、品質の低下が目立つことがあります。

ファイルの圧縮は安全ですか?

はい、データの整合性の面では、特にロスレス圧縮ではファイルの圧縮は安全です。しかし、他のファイルと同様に、圧縮ファイルはマルウェアやウイルスの標的になる可能性があるため、常に信頼することができるセキュリティソフトウェアを用意しておくことが重要です。

どの種類のファイルを圧縮できますか?

ほぼすべてのタイプのファイルが圧縮可能であり、テキストファイル、画像、音声、動画、ソフトウェアファイルなどがあります。ただし、圧縮可能なレベルは、ファイルタイプによって大幅に異なることがあります。

ZIPファイルとは何を意味しますか?

ZIPファイルは、1つ以上のファイルのサイズを減らすためにロスレス圧縮を使用するファイル形式の一種です。ZIPファイルの中の複数のファイルは、実質的に1つのファイルにまとめられるため、共有も簡単になります。

すでに圧縮されたファイルを圧縮することはできますか?

技術的にははい、ですが、さらなるサイズ縮小は最小限で、あるいは逆効果となる可能性があります。既に圧縮されたファイルを圧縮すると、圧縮アルゴリズムによって追加されたメタデータにより、そのサイズが増えることがあります。

ファイルを解凍するにはどうすればいいですか?

ファイルを解凍するには、通常、解凍ツールやアンジッパーといったツール、例えばWinZipや7-Zipが必要です。これらのツールは、圧縮形式から元のファイルを抽出することができます。