V7TAR ファイルを抽出する

無制限の ジョブ。ファイルサイズは最大 2.5GB。永久に無料。

プライベートで安全

すべてがブラウザで行われます。あなたのファイルが私たちのサーバーに触れることはありません。

超高速

アップロードも待つ必要もありません。ファイルをドロップした瞬間に変換します。

本当に無料

アカウントは必要ありません。隠れたコストもありません。ファイルサイズのトリックもありません。

V7TAR フォーマットとは何ですか?

バージョン7 tar

.tar.bz2 アーカイブ形式は、tar(テープアーカイブ)形式と bzip2 圧縮アルゴリズムを組み合わせた、広く使用されている圧縮アーカイブ形式です。この形式は、Unix 系システムでファイルの配布とバックアップに一般的に使用されており、効率的な圧縮を提供し、ファイルの権限、所有権、ディレクトリ構造を保持します。

tar 形式はもともと磁気テープにファイルを格納するために開発されましたが、それ以来、ディスクドライブでの使用に適応されています。tar アーカイブは一連のファイルレコードで構成されており、各レコードにはファイルに関するメタデータ(名前、サイズ、権限など)が含まれ、その後にファイルデータ自体が続きます。tar アーカイブ内のファイルは、追加の圧縮なしで連結されます。

Bzip2 は、Burrows-Wheeler 変換とハフマン符号化を使用して高い圧縮率を達成する、可逆データ圧縮アルゴリズムです。これは、1996 年に Julian Seward によって、gzip 圧縮アルゴリズムのより効率的な代替手段として開発されました。Bzip2 はデータを固定サイズのブロック(通常は 900 KB)で圧縮するため、特に大規模なファイルでは gzip よりも優れた圧縮率を実現できます。

tar アーカイブが bzip2 で圧縮されると、結果のファイルには .tar.bz2 または .tbz2 のファイル拡張子が付けられます。圧縮プロセスは tar アーカイブの作成後に実行されるため、元のファイルメタデータは保持されます。.tar.bz2 アーカイブからファイルを抽出するには、最初に bzip2 解凍アルゴリズムがアーカイブ全体に適用され、次に結果の tar アーカイブが処理されて個々のファイルが抽出されます。

.tar.bz2 形式には、他のアーカイブ形式に対するいくつかの利点があります。まず、高いレベルの圧縮を提供するため、ストレージ要件が削減され、ネットワーク経由でのファイル転送が高速化されます。次に、権限や所有権を含む元のファイルメタデータを保持するため、ファイルの整合性を維持するために重要です。第 3 に、tar 形式では複数のアーカイブを簡単に連結できるため、バックアップと復元操作が簡素化されます。

ただし、.tar.bz2 形式にはいくつかの制限もあります。1 つは、圧縮と解凍のプロセスが、特に大規模なアーカイブでは比較的遅くなる可能性があることです。これは、bzip2 が gzip などの他の圧縮方法よりも計算負荷の高いアルゴリズムであるためです。もう 1 つの制限は、.tar.bz2 形式が .zip などの他のアーカイブ形式ほど広くサポートされていないため、異なるシステム間でファイルを共有するときに互換性の問題が発生する可能性があることです。

これらの制限にもかかわらず、.tar.bz2 形式は Unix 系システムでファイルをアーカイブおよび配布するための一般的な選択肢のままであり、ほとんどの最新のオペレーティングシステムでサポートされており、tar や bzip2 などのコマンドラインツールを使用して簡単に作成および抽出できます。多くのソフトウェアパッケージとソースコード配布は .tar.bz2 アーカイブとして配布されているため、開発者やシステム管理者が精通しておくべき重要な形式です。

ソフトウェア配布での使用に加えて、.tar.bz2 形式はバックアップと長期アーカイブストレージにも一般的に使用されます。ファイルメタデータとディレクトリ構造を保持する機能により、データ損失やシステム障害が発生した場合に簡単に復元できる完全なシステムバックアップを作成するのに適しています。ただし、大規模なバックアップでは、より高速な圧縮と解凍速度が得られる .tar.gz や .7z などの他の形式が好まれる場合があります。

.tar.bz2 アーカイブを操作するときは、アーカイブの作成と抽出に適切なツールとオプションが使用されていることを確認することが重要です。tar コマンドは tar アーカイブの作成と抽出に使用され、bzip2 コマンドはデータの圧縮と解凍に使用されます。.tar.bz2 アーカイブを作成するには、tar コマンドを -c(作成)、-j(bzip2 圧縮)、-f(ファイル名)オプションとともに使用し、次にアーカイブするファイルまたはディレクトリの名前を指定します。たとえば、次のようになります。

```bash tar cjf archive.tar.bz2 directory/ ```

.tar.bz2 アーカイブを抽出するには、tar コマンドを -x(抽出)、-j(bzip2 解凍)、-f(ファイル名)オプションとともに使用し、次にアーカイブファイルの名前を指定します。たとえば、次のようになります。

```bash tar xjf archive.tar.bz2 ```

-x の代わりに -t(リスト)オプションを使用すると、.tar.bz2 アーカイブの内容を抽出せずにプレビューすることもできます。これは、アーカイブを抽出する前にその内容を確認するために役立ちます。

配布または長期保存用に .tar.bz2 アーカイブを作成するときは、アーカイブと tar および bzip2 ツールのさまざまなシステムとバージョンの互換性を考慮することが重要です。これらのツールの古いバージョンの中には、新しいバージョンで使用されるすべての機能やオプションをサポートしていないものがあり、アーカイブの抽出時に問題が発生する可能性があります。アーカイブを作成するときは、tar と bzip2 の最新の安定バージョンを使用し、さまざまなシステムでアーカイブをテストして互換性を確保することをお勧めします。

.tar.bz2 アーカイブを使用する際のもう 1 つの考慮事項は、使用する圧縮レベルです。Bzip2 は、1(最速、圧縮率が最も低い)から 9(最遅、圧縮率が最も高い)までの圧縮レベルをサポートしており、デフォルトレベルは 9 です。より高い圧縮レベルを使用すると、アーカイブファイルは小さくなりますが、圧縮と解凍に時間がかかります。場合によっては、結果のアーカイブファイルがわずかに大きくなっても、より高速な圧縮と解凍時間を達成するために、より低い圧縮レベルを使用する方が効率的です。

要約すると、.tar.bz2 アーカイブ形式は、Unix 系システムでファイルをアーカイブおよび配布するための強力で柔軟なツールです。ファイルメタデータを保持するための tar 形式と効率的な圧縮のための bzip2 アルゴリズムの組み合わせにより、ソフトウェア配布からシステムバックアップまで、さまざまなユースケースに適しています。速度と互換性の点でいくつかの制限がありますが、幅広いサポートと大規模で複雑なファイル階層を処理する機能により、多くのコンピューティング環境で理解して使用することが重要な形式となっています。

ファイル圧縮は冗長性を減らすことで、同じ情報がより少ないビットで済むようにします。どこまで圧縮できるかの上限は情報理論によって定められています。可逆圧縮の場合、その限界はソースのエントロピーです(シャノンの ソース符号化定理 と彼の1948年の独創的な論文 「通信の数学的理論」を参照)。非可逆圧縮の場合、レートと品質のトレードオフは レート歪み理論によって捉えられます。

2つの柱:モデリングとコーディング

ほとんどの圧縮プログラムには2つの段階があります。まず、モデルがデータ内の構造を予測または公開します。 次に、コーダーがそれらの予測をほぼ最適なビットパターンに変換します。古典的なモデリング ファミリーはレンペル–ジブです。 LZ77 (1977) とLZ78 (1978)は、繰り返される部分文字列を検出し、生のバイトの代わりに参照を出力します。 コーディング側では、 ハフマン符号化 (元の論文 1952を参照)は、より可能性の高いシンボルに短いコードを割り当てます。 算術符号化 範囲符号化 は、エントロピー限界に近づけるためのよりきめ細かい代替手段であり、現代の 非対称数系(ANS) は、高速なテーブル駆動の実装で同様の圧縮を実現します。

一般的なフォーマットが実際に何をしているか

DEFLATEgzipzlibZIPで使用)は、LZ77とハフマン符号化を組み合わせたものです。その仕様は公開されています: DEFLATE RFC 1951、zlibラッパー RFC 1950、およびgzipファイル形式 RFC 1952。Gzipはストリーミング用にフレーム化されており、明示的に ランダムアクセスを提供しようとはしません。PNG画像は、PNG仕様書によれば、DEFLATEを唯一の圧縮方法として標準化しています(最大32 KiBのウィンドウ)。 「圧縮方法0… deflate/inflate… 最大32768バイト」 および W3C/ISO PNG第2版

Zstandard (zstd): 非常に高速な 解凍で高い圧縮率を実現するために設計された、新しい汎用圧縮プログラムです。この形式は RFC 8878 HTMLミラーも参照)および参照仕様書 GitHubで文書化されています。gzipと同様に、基本フレームは ランダムアクセスを目的としていません。zstdのスーパーパワーの1つは辞書です。コーパスからの小さなサンプルで、多数の小さなファイルや類似のファイルで 圧縮を劇的に改善します( python-zstandard辞書ドキュメント および Nigel Taoの実例を参照)。実装は、「非構造化」と「構造化」の両方の辞書を受け入れます (ディスカッション)

Brotli: ウェブコンテンツ(例:WOFF2フォント、HTTP)に最適化されています。静的辞書と DEFLATEのようなLZ+エントロピーコアを組み合わせます。仕様は RFC 7932で、2WBITS−16のスライディングウィンドウ(WBITSは[10, 24]、1 KiB−16 Bから 16 MiB−16 Bまで)と、 ランダムアクセスを試みないことも記されています。Brotliは、ウェブテキストでgzipをしばしば上回り、高速にデコードします。

ZIPコンテナ: ZIPは、さまざまな圧縮方法 (deflate、store、zstdなど)でエントリを保存できるファイルアーカイブです。事実上の標準はPKWAREのAPPNOTEです( APPNOTEポータル ホストされているコピー、およびLCの概要 ZIPファイル形式(PKWARE) / ZIP 6.3.3を参照)。

速度と圧縮率:フォーマットの位置づけ

LZ4は、控えめな圧縮率で生の速度を目標としています。その プロジェクトページ (「非常に高速な圧縮」)と フレーム形式を参照してください。メモリ内キャッシュ、テレメトリ、または解凍がRAM速度に近い必要があるホットパスに最適です。

XZ / LZMAは、比較的遅い圧縮で密度(優れた圧縮率)を追求します。XZはコンテナです。 重労働は通常、LZMA/LZMA2(LZ77のようなモデリング+範囲符号化)によって行われます。 .xzファイル形式 LZMA仕様(Pavlov)、およびLinuxカーネルのメモ XZ Embeddedについてを参照してください。XZは通常、gzipを上回り、高圧縮率の最新コーデックとしばしば競合しますが、エンコード時間は遅くなります。

bzip2は、 Burrows–Wheeler変換(BWT)、move-to-front、RLE、およびハフマン符号化を適用します。通常、gzipよりも小さいですが遅いです。 公式マニュアル およびmanページ (Linux)を参照してください。

ウィンドウ、ブロック、ランダムアクセス

「ウィンドウサイズ」は重要です。DEFLATE参照は32 KiBしか遡れません RFC 1951 およびPNGの32 KiBキャップ ここに記載)。Brotliのウィンドウは、約1 KiBから16 MiBの範囲です (RFC 7932)。Zstdは、レベルごとにウィンドウと検索深度を調整します (RFC 8878)。基本的なgzip/zstd/brotliストリームは、シーケンシャルデコード用に設計されています。基本形式は ランダムアクセスを約束しませんが、コンテナ(例:tarインデックス、チャンク化されたフレーミング、または形式固有のインデックス)でそれを階層化できます。

可逆対非可逆

上記の形式は可逆です。正確なバイトを再構築できます。メディアコーデックはしばしば非可逆です。 より低いビットレートを達成するために、知覚できない詳細を破棄します。画像では、古典的なJPEG(DCT、量子化、エントロピー 符号化)は ITU-T T.81 / ISO/IEC 10918-1で標準化されています。音声では、MP3(MPEG-1 Layer III)とAAC(MPEG-2/4)は、知覚モデルとMDCT変換に依存しています( ISO/IEC 11172-3 ISO/IEC 13818-7、およびMDCTの概要 こちらを参照)。非可逆と可逆は共存できます(例:UIアセット用のPNG、画像/動画/音声用のWebコーデック)。

実践的なヒント

  • 仕事に合わせて選ぶ。 ウェブテキストとフォント: brotli。一般的なファイルとバックアップ: zstd (優れた解凍速度と、時間と圧縮率を交換するレベル)。超高速パイプとテレメトリ: lz4。エンコード時間が問題にならない長期アーカイブの最大密度: xz/LZMA
  • 小さなファイル? zstd (ドキュメント) / (例)で辞書をトレーニングして配布します。何十もの小さな類似オブジェクトを劇的に縮小できます。
  • 相互運用性。 複数のファイルを交換する場合は、コンテナ(ZIP、tar)と 圧縮プログラムを優先します。ZIPのAPPNOTEは、メソッドIDと機能を定義しています。 PKWARE APPNOTE およびLCの概要 こちらを参照してください。
  • データで測定する。 圧縮率と速度はコーパスによって異なります。多くのリポジトリがベンチマークを公開しています(例: LZ4のREADMEはSilesiaコーパスを こちらで引用しています)が、常にローカルで検証してください。

主要な参考文献(詳細)

理論: シャノン 1948 · レート歪み · 符号化: ハフマン 1952 · 算術符号化 · 範囲符号化 · ANS. フォーマット: DEFLATE · zlib · gzip · Zstandard · Brotli · LZ4フレーム · XZ形式. BWTスタック: Burrows–Wheeler (1994) · bzip2マニュアル. メディア: JPEG T.81 · MP3 ISO/IEC 11172-3 · AAC ISO/IEC 13818-7 · MDCT.

結論:データと制約に合った圧縮プログラムを選択し、実際の入力で測定し、 辞書とスマートフレーミングによる利点を忘れないでください。適切な組み合わせで、 より小さなファイル、より速い転送、より軽快なアプリを手に入れることができます—正確さや移植性を犠牲にすることなく。

よくある質問

ファイルの圧縮とは何ですか?

ファイルの圧縮は、ファイルやファイルのサイズを減らすプロセスで、通常はストレージスペースを節約したり、ネットワークを介した伝送を高速化するために使用されます。

ファイルの圧縮はどのように機能しますか?

ファイルの圧縮は、データの冗長性を識別して削除することで機能します。それはアルゴリズムを使用して、元のデータをより小さいスペースでエンコードします。

ファイルの圧縮の種類は何ですか?

ファイルの圧縮の主要な2つのタイプはロスレス圧縮とロッシー圧縮です。ロスレス圧縮では、元のファイルを完全に復元することができますが、ロッシー圧縮ではデータ品質の若干の損失を伴うより大きなサイズの削減が可能になります。

ファイルの圧縮ツールの例は何ですか?

ファイルの圧縮ツールの人気の例はWinZipで、ZIPとRARを含む複数の圧縮形式をサポートしています。

ファイルの圧縮はファイルの品質に影響しますか?

ロスレス圧縮では品質は変わりません。しかし、ロッシー圧縮では、それほど重要ではないデータを削除してファイルサイズをより大幅に削減するため、品質の低下が目立つことがあります。

ファイルの圧縮は安全ですか?

はい、データの整合性の面では、特にロスレス圧縮ではファイルの圧縮は安全です。しかし、他のファイルと同様に、圧縮ファイルはマルウェアやウイルスの標的になる可能性があるため、常に信頼することができるセキュリティソフトウェアを用意しておくことが重要です。

どの種類のファイルを圧縮できますか?

ほぼすべてのタイプのファイルが圧縮可能であり、テキストファイル、画像、音声、動画、ソフトウェアファイルなどがあります。ただし、圧縮可能なレベルは、ファイルタイプによって大幅に異なることがあります。

ZIPファイルとは何を意味しますか?

ZIPファイルは、1つ以上のファイルのサイズを減らすためにロスレス圧縮を使用するファイル形式の一種です。ZIPファイルの中の複数のファイルは、実質的に1つのファイルにまとめられるため、共有も簡単になります。

すでに圧縮されたファイルを圧縮することはできますか?

技術的にははい、ですが、さらなるサイズ縮小は最小限で、あるいは逆効果となる可能性があります。既に圧縮されたファイルを圧縮すると、圧縮アルゴリズムによって追加されたメタデータにより、そのサイズが増えることがあります。

ファイルを解凍するにはどうすればいいですか?

ファイルを解凍するには、通常、解凍ツールやアンジッパーといったツール、例えばWinZipや7-Zipが必要です。これらのツールは、圧縮形式から元のファイルを抽出することができます。