SHAR ファイルを抽出する

無制限の ジョブ。ファイルサイズは最大 2.5GB。永久に無料。

すべてローカルで実行

コンバーターはブラウザ内で動作するため、データは決して見られません。

超高速

ファイルをサーバにアップロードすることなく、変換は瞬時に開始されます。

デフォルトで安全

他のコンバータとは異なり、ファイルは決してアップロードされません。

SHAR フォーマットとは何ですか?

シェルアーカイブ

PAX(Packed Archive Format)は、ファイルとディレクトリのアーカイブと圧縮に使用されるファイル形式です。これはもともと Google によって開発され、ZIP と tar 形式の技術の組み合わせに基づいています。PAX は、効率的な圧縮、ファイルへの高速なランダムアクセス、カスタムメタデータの拡張性を提供することを目的としています。

PAX アーカイブは、本質的に、アーカイブされたファイルに関するメタデータを含む中央ディレクトリで構成され、その後に圧縮されたファイルデータ自体が続きます。中央ディレクトリは、ファイル全体をスキャンする必要なく、すばやくアクセスできるように、常にアーカイブの最後に配置されます。

中央ディレクトリの各ファイルエントリには、ファイルパス、サイズ、タイムスタンプ、CRC32 チェックサム、使用される圧縮方式などの情報が含まれます。ファイルパスは Unicode 文字列として格納され、非 ASCII ファイル名のサポートが可能です。PAX はファイルパスに UTF-8 エンコーディングを使用します。

圧縮のために、PAX は DEFLATE、Brotli、Zstandard(zstd)を含む複数のアルゴリズムをサポートしています。DEFLATE は、ZIP と gzip で使用されるのと同じアルゴリズムであるデフォルトの方式です。圧縮率と速度のバランスが優れています。Brotli と Zstandard は、テキストファイルなどの特定のタイプのデータで特に優れた圧縮率を提供できる新しいアルゴリズムですが、圧縮と解凍の速度が低下します。

PAX の圧縮されたファイルデータはチャンクに格納され、各チャンクの最大未圧縮サイズは 1 MB です。このチャンク化されたストレージにより、アーカイブ全体を処理するのではなく、必要なチャンクのみを特定して解凍することで、ファイルへの効率的なランダムアクセスが可能になります。

PAX の重要な機能の 1 つは、ソリッド圧縮のサポートです。ソリッド圧縮では、アーカイブは個別のファイルのコレクションではなく、単一の連続したデータストリームとして扱われます。これにより、コンプレッサはファイルの境界を越えて冗長性とパターンを見つけることができ、結果として圧縮率が向上する可能性があります。ただし、ソリッド圧縮は、目的のファイルまでのアーカイブ全体を解凍する必要がある場合があるため、個々のファイルにすばやくアクセスする機能に影響を与える可能性があります。

PAX には、データの破損を検出するための整合性チェックも含まれています。中央ディレクトリの各ファイルエントリには、未圧縮ファイルデータの CRC32 チェックサムが含まれます。ファイルを抽出すると、PAX は解凍されたデータのチェックサムを計算し、格納されたチェックサムと比較して整合性を検証します。さらに、PAX アーカイブには、認証と改ざん検出を提供するためのオプションのデジタル署名を含めることができます。

パフォーマンスを向上させるために、PAX はマルチスレッド圧縮と解凍をサポートしています。ファイルは並列に圧縮してアーカイブに書き込むことができ、複数の CPU コアを利用できます。同様に、抽出時には、複数のファイルを同時に解凍できます。この並列処理により、マルチコアシステムでのアーカイブと抽出の操作が大幅に高速化されます。

PAX アーカイブは、標準ファイル属性を超える追加のメタデータも格納できます。カスタムメタデータは、キーと値のペアを使用してファイルとディレクトリに割り当てることができます。このメタデータは、ファイルエントリと一緒に中央ディレクトリに格納されます。カスタムメタデータの例としては、作成者情報、ファイルカテゴリ、アプリケーション固有のデータなどがあります。

ストリーミングサポートは PAX のもう 1 つの機能です。アーカイブは、アーカイブ全体をメモリにロードする必要なく、ストリーミング方式で作成および抽出できます。これは、大規模なアーカイブを扱う場合や、限られたメモリリソースで作業する場合に特に役立ちます。ストリーミングにより、アーカイブをその場で作成したり、ネットワーク接続を介してデータを受信するときに処理したりできます。

下位互換性と相互運用性のために、PAX アーカイブにはフォールバック ZIP アーカイブを含めることができます。ZIP アーカイブは PAX アーカイブの最後に追加され、従来の ZIP 形式で同じファイルが含まれます。これにより、PAX をサポートしていない古いツールでも、アーカイブの ZIP 部分からファイルを抽出できます。

PAX は、その効率性、柔軟性、オープンソース実装により人気が高まっています。さまざまなプラットフォームのさまざまなアーカイブツールとライブラリでサポートされています。libpax と呼ばれるリファレンス実装は C で記述されており、PAX アーカイブを作成および抽出するための低レベル API を提供します。

PAX の制限の 1 つは、ネイティブに暗号化をサポートしていないことです。ただし、PAX を他の暗号化技術と組み合わせるか、PAX 形式に基づいて構築されたサードパーティツールを使用することで、暗号化を実現できます。

要約すると、PAX(Packed Archive Format)は、高速ランダムアクセス、ソリッド圧縮、並列処理、カスタムメタデータ、ストリーミングサポートなどの機能を提供する、汎用的で効率的なファイルアーカイブ形式です。圧縮アルゴリズム、チャンク化されたストレージ、拡張性の組み合わせにより、ファイルのアーカイブと配布に最適な選択肢となります。

ファイルの圧縮は、データファイルのサイズを効率的に保管または送信するために削減するプロセスです。様々なアルゴリズムを使用して、冗長性を特定し、排除することにより、データを圧縮します。これにより、元の情報を失うことなくデータのサイズを大幅に減らすことが可能となります。

ファイル圧縮には二つの主なタイプがあります: ロスレスとロッシー。ロスレス圧縮では、圧縮されたデータから元のデータを完全に再構築することができます。これはテキストやデータベースファイルのように、すべてのビットのデータが重要なファイルに理想的です。一般的な例としてはZIPやRARのファイル形式があります。一方、ロッシー圧縮では、より重要でないデータを排除してファイルサイズをより大幅に削減します。これは音声、映像、画像ファイルによく使用されます。JPEGやMP3は、ある程度のデータロスがコンテンツの知覚品質を大幅に劣化させない例です。

ファイル圧縮は多方面にわたって有益です。デバイスやサーバーのストレージスペースを節約し、コストを抑え、効率を向上させます。また、ネットワークを通じたファイル送信時間を短縮することもできます。これは特に大きなファイルに対して価値があります。さらに、圧縮ファイルは1つのアーカイブファイルにまとめることができ、整理や複数ファイルの輸送が容易になります。

しかし、ファイル圧縮にはいくつかの欠点もあります。圧縮と解凍のプロセスには計算リソースが必要で、特に大きなファイルの場合、システムのパフォーマンスを低下させる可能性があります。また、ロッシー圧縮の場合、一部の元のデータが圧縮時に失われ、結果として生じる品質がすべての用途に対して十分でない場合もあります。特に高品質が求められるプロフェッショナルなアプリケーションなどです。

ファイル圧縮は、今日のデジタルワールドで重要なツールです。それは効率性を向上させ、ストレージスペースを節約し、ダウンロードとアップロードの時間を短縮します。それにもかかわらず、システムパフォーマンスや品質劣化のリスクという自身の問題を抱えています。そのため、これらの要素を考慮に入れて特定のデータニーズに対して適切な圧縮技術を選択することが重要です。

よくある質問

ファイルの圧縮とは何ですか?

ファイルの圧縮は、ファイルやファイルのサイズを減らすプロセスで、通常はストレージスペースを節約したり、ネットワークを介した伝送を高速化するために使用されます。

ファイルの圧縮はどのように機能しますか?

ファイルの圧縮は、データの冗長性を識別して削除することで機能します。それはアルゴリズムを使用して、元のデータをより小さいスペースでエンコードします。

ファイルの圧縮の種類は何ですか?

ファイルの圧縮の主要な2つのタイプはロスレス圧縮とロッシー圧縮です。ロスレス圧縮では、元のファイルを完全に復元することができますが、ロッシー圧縮ではデータ品質の若干の損失を伴うより大きなサイズの削減が可能になります。

ファイルの圧縮ツールの例は何ですか?

ファイルの圧縮ツールの人気の例はWinZipで、ZIPとRARを含む複数の圧縮形式をサポートしています。

ファイルの圧縮はファイルの品質に影響しますか?

ロスレス圧縮では品質は変わりません。しかし、ロッシー圧縮では、それほど重要ではないデータを削除してファイルサイズをより大幅に削減するため、品質の低下が目立つことがあります。

ファイルの圧縮は安全ですか?

はい、データの整合性の面では、特にロスレス圧縮ではファイルの圧縮は安全です。しかし、他のファイルと同様に、圧縮ファイルはマルウェアやウイルスの標的になる可能性があるため、常に信頼することができるセキュリティソフトウェアを用意しておくことが重要です。

どの種類のファイルを圧縮できますか?

ほぼすべてのタイプのファイルが圧縮可能であり、テキストファイル、画像、音声、動画、ソフトウェアファイルなどがあります。ただし、圧縮可能なレベルは、ファイルタイプによって大幅に異なることがあります。

ZIPファイルとは何を意味しますか?

ZIPファイルは、1つ以上のファイルのサイズを減らすためにロスレス圧縮を使用するファイル形式の一種です。ZIPファイルの中の複数のファイルは、実質的に1つのファイルにまとめられるため、共有も簡単になります。

すでに圧縮されたファイルを圧縮することはできますか?

技術的にははい、ですが、さらなるサイズ縮小は最小限で、あるいは逆効果となる可能性があります。既に圧縮されたファイルを圧縮すると、圧縮アルゴリズムによって追加されたメタデータにより、そのサイズが増えることがあります。

ファイルを解凍するにはどうすればいいですか?

ファイルを解凍するには、通常、解凍ツールやアンジッパーといったツール、例えばWinZipや7-Zipが必要です。これらのツールは、圧縮形式から元のファイルを抽出することができます。