背景の削除は、被写体を周囲から分離し、透明な背景に配置したり、 シーンを交換したり、新しいデザインに合成したりできるようにします。内部では、 アルファマット(ピクセルごとの不透明度0〜1)を推定し、前景を何か他のものの上にアルファ合成しています。これはポーター-ダフの数学であり、「フリンジ」や ストレートアルファ対乗算済みアルファのようなおなじみの落とし穴の原因です。乗算済みアルファとリニアカラーに関する実践的なガイダンスについては、 MicrosoftのWin2Dノート、 Søren Sandmann、および Lomontのリニアブレンドに関する記事を参照してください。
キャプチャを制御できる場合は、背景を単色(多くの場合緑)で塗りつぶし、その色相をキーアウトします。 これは高速で、映画や放送で実証済みであり、ビデオに最適です。トレードオフは照明とワードローブです。 色付きの光がエッジ(特に髪)にこぼれるため、デスピルツールを使用して汚染を中和します。 優れた入門書には、Nukeのドキュメント、 Mixing Light、および実践的な Fusionデモが含まれます。
背景が乱雑な単一の画像の場合、インタラクティブアルゴリズムには、ユーザーからのいくつかのヒント(たとえば、緩い 長方形や落書き)が必要であり、鮮明なマスクに収束します。標準的な方法は GrabCut (本の章)であり、前景/背景のカラーモデルを学習し、グラフカットを繰り返し使用してそれらを分離します。GIMPの前景選択では、 SIOX (ImageJプラグイン)に基づいた同様のアイデアが見られます。
マッティングは、かすかな境界(髪、毛皮、煙、ガラス)での部分的な透明度を解決します。クラシックな クローズドフォームマッティングは、 トライマップ(明確な前景/明確な背景/不明)を取得し、強力なエッジ忠実度でアルファの線形システムを解きます。現代の ディープイメージマッティングは、 Adobe Composition-1Kデータセット(MMEditingドキュメント)でニューラルネットワークをトレーニングし、 SAD、MSE、Gradient、Connectivity(ベンチマークの説明)などのメトリックで評価されます。
関連するセグメンテーション作業も役立ちます: DeepLabv3+は、エンコーダー-デコーダーとatrous畳み込みで境界を洗練します (PDF); Mask R-CNNは、インスタンスごとのマスクを提供します (PDF); そして SAM(Segment Anything)は、 なじみのない画像に対してゼロショットマスクを生成するプロンプト可能な基盤モデルです。
学術研究では、Composition-1Kに関するSAD、MSE、Gradient、およびConnectivityエラーが報告されています。モデルを選択する場合は、これらのメトリックを探してください (メトリックの定義; Background Mattingのメトリックセクション)。 ポートレート/ビデオの場合、MODNetと Background Matting V2は強力です。一般的な「顕著なオブジェクト」画像の場合、 U2-Netは堅実なベースラインです。困難な透明度の場合、 FBAはよりクリーンになる可能性があります。
AVIF(AV1イメージファイルフォーマット)は、JPEG、PNG、WebPなどの古いフォーマットと比較して優れた圧縮効率を提供するためにAV1ビデオコーデックを利用する最新の画像ファイルフォーマットです。Alliance for Open Media(AOMedia)によって開発されたAVIFは、ファイルサイズを小さくして高品質の画像を提供することを目指しており、ウェブサイトやアプリケーションを最適化したいウェブ開発者やコンテンツクリエイターにとって魅力的な選択肢となっています。
AVIFの中核には、H.264やHEVCなどの独自のコーデックに代わるロイヤリティフリーの選択肢として設計されたAV1ビデオコーデックがあります。AV1は、フレーム内予測とフレーム間予測、変換コーディング、エントロピーコーディングなどの高度な圧縮技術を採用して、視覚品質を維持しながらビットレートを大幅に節約します。AV1のフレーム内コーディング機能を活用することで、AVIFは従来のフォーマットよりも静止画像をより効率的に圧縮できます。
AVIFの重要な機能の1つは、可逆圧縮と非可逆圧縮の両方をサポートしていることです。非可逆圧縮は、画像品質を犠牲にしてより高い圧縮率を可能にする一方、可逆圧縮は情報の損失なしに元の画像データを保持します。この柔軟性により、開発者はファイルサイズと画像の忠実度のバランスを取りながら、特定の要件に基づいて適切な圧縮モードを選択できます。
AVIFは、さまざまな画像タイプやユースケースに適した、幅広いカラースペースとビット深度もサポートしています。8ビットから12ビット/チャンネルのビット深度で、RGBとYUVの両方 のカラースペースを処理できます。さらに、AVIFはハイダイナミックレンジ(HDR)イメージングをサポートしており、より広い範囲の輝度値とより鮮やかな色を表現できます。この機能は、HDRディスプレイとコンテンツに特に役立ちます。
AVIFのもう1つの大きな利点は、アルファチャンネルを使用して画像をエンコードし、透過性を可能にすることです。この機能は、さまざまな背景色やパターンとシームレスに統合する必要があるグラフィックスやロゴに不可欠です。AVIFのアルファチャンネルサポートは、PNGと比較してより効率的であり、画像データと一緒に透過情報を圧縮できます。
AVIF画像を作成するには、まずソース画像データを通常64x64ピクセルのコーディングユニットのグリッドに分割します。次に、各コーディングユニットはさらに小さなブロックに分割され、AV1エンコーダーによって独立して処理されます。エンコーダーは、予測、変換コーディング、量子化、エントロピーコーディングなどの圧縮技術のシーケンスを適用して、画像品質を維持しながらデータサイズを削減します。
予測段階では、エンコーダーはフレーム内予測を使用して、周囲のピクセルに基づいてブロック内のピクセル値を推定します。このプロセスは空間的冗長性を活用し、エンコードする必要があるデータ量を削減するのに役立ちます。ビデオ圧縮で使用されるフレーム間予測は、AVIFなどの静止画像には適用できません。
予測後、残差データ(予測値と実際のピクセル値の差)は変換コーディングを受けます。AV1コーデックは、離散コサイン変換(DCT)と非対称離散正弦変換(ADST)関数のセットを使用し て、空間ドメインデータを周波数ドメインに変換します。このステップは、残差信号のエネルギーをより少ない係数に集中させるのに役立ち、圧縮しやすくします。
次に、量子化が変換された係数に適用されて、データの精度が低下します。量子化は、あまり重要でない情報を破棄することで、画像品質を多少失う代わりに、より高い圧縮率を可能にします。量子化パラメーターは、ファイルサイズと画像の忠実度のトレードオフを制御するために調整できます。
最後に、算術コーディングや可変長コーディングなどのエントロピーコーディング技術を使用して、量子化された係数をさらに圧縮します。これらの技術は、より頻繁に出現するシンボルに短いコードを割り当て、画像データのよりコンパクトな表現を作成します。
エンコーディングプロセスが完了すると、圧縮された画像データは、画像の寸法、カラースペース、ビット深度などのメタデータを含むAVIFコンテナーフォーマットにパッケージされます。結果のAVIFファイルは、他の画像フォーマットと比較してストレージスペースや帯域幅をあまり占有せずに、効率的に保存または送信できます。
AVIF画像をデコードするには、逆のプロセスに従います。デコーダーは、AVIFコンテナーから圧縮された画像データを抽出し、エントロピーデコーディングを適用して量子化された係数を再構築します。次に、逆量子化と逆変換コーディングを実行して、残差データを取得します。フレーム内予測から得られた予測ピクセル値が、残差データに追加されて最終的な画像が再構築されます。
AVIFを採用する際の課題の1つは、JPEGやPNGなどの確 立されたフォーマットと比較して、比較的最近導入されたものであり、ブラウザのサポートが限られていることです。ただし、より多くのブラウザや画像処理ツールがAVIFをネイティブにサポートするようになると、効率的な画像圧縮に対する需要の高まりに後押しされて、採用が進むと予想されます。
互換性の問題に対処するために、ウェブサイトやアプリケーションはフォールバックメカニズムを採用し、互換性のあるクライアントにAVIF画像を提供し、古いブラウザにはJPEGやWebPなどの代替フォーマットを提供できます。このアプローチにより、ユーザーはブラウザがAVIFをサポートしているかどうかに関係なく、コンテンツにアクセスできます。
結論として、AVIFは、優れた圧縮効率を提供するためにAV1ビデオコーデックの力を活用する有望な画像ファイルフォーマットです。可逆圧縮と非可逆圧縮、幅広いカラースペースとビット深度、HDRイメージング、アルファチャンネルの透過性をサポートするAVIFは、Web上の画像を最適化するための汎用的なソリューションを提供します。ブラウザのサポートが拡大し続け、より多くのツールがAVIFを採用するにつれて、視覚品質を損なうことなく画像ファイルサイズを削減しようとする開発者やコンテンツクリエイターにとって、好ましい選択肢となる可能性があります。
このコンバーターはブラウザ内で完全に動作します。ファイルを選択すると、メモリに読み込まれ、選択したフォーマットに変換されます。その後、変換されたファイルをダウンロードできます。
変換は瞬時に開始され、ほとんどのファイルは1秒以内に変換されます。大きなファイルの場合、時間がかかる場合があります。
ファイルは決してサーバにアップロードされません。ブラウザ内で変換され、変換されたファイルがダウンロードされます。ファイルは見られません。
画像フォーマット間の変換すべてに対応しています。JPEG、PNG、GIF、WebP、SVG、BMP、TIFFなどです。
このコンバーターは完全に無料で、永久に無料のままです。ブラウザ内で動作するため、サーバを用意する必要がないので、料金を請求する必要がありません。
はい、一度に複数のファイルを変換できます。追加時に複数のファイルを選択してください。