背景の削除は、被写体を周囲から分離し、透明な背景に配置したり、 シーンを交換したり、新しいデザインに合成したりできるようにします。内部では、 アルファマット(ピクセルごとの不透明度0〜1)を推定し、前景を何か他のものの上にアルファ合成しています。これはポーター-ダフの数学であり、「フリンジ」や ストレートアルファ対乗算済みアルファのようなおなじみの落とし穴の原因です。乗算済みアルファとリニアカラーに関する実践的なガイダンスについては、 MicrosoftのWin2Dノート、 Søren Sandmann、および Lomontのリニアブレンドに関する記事を参照してください。
キャプチャを制御できる場合は、背景を単色(多くの場合緑)で塗りつぶし、その色相をキーアウトします。 これは高速で、映画や放送で実証済みであり、ビデオに最適です。トレードオフは照明とワードローブです。 色付きの光がエッジ(特に髪)にこぼれるため、デスピルツールを使用して汚染を中和します。 優れた入門書には、Nukeのドキュメント、 Mixing Light、および実践的な Fusionデモが含まれます。
背景が乱雑な単一の画像の場合、インタラクティブアルゴリズムには、ユーザーからのいくつかのヒント(たとえば、緩い 長方形や落書き)が必要であり、鮮明なマスクに収束します。標準的な方法は GrabCut (本の章)であり、前景/背景のカラーモデルを学習し、グラフカットを繰り返し使用してそれらを分離します。GIMPの前景選択では、 SIOX (ImageJプラグイン)に基づいた同様のアイデアが見られます。
マッティングは、かすかな境界(髪、毛皮、煙、ガラス)での部分的な透明度を解決します。クラシックな クローズドフォームマッティングは、 トライマップ(明確な前景/明確な背景/不明)を取得し、強力なエッジ忠実度で アルファの線形システムを解きます。現代の ディープイメージマッティングは、 Adobe Composition-1Kデータセット(MMEditingドキュメント)でニューラルネットワークをトレーニングし、 SAD、MSE、Gradient、Connectivity(ベンチマークの説明)などのメトリックで評価されます。
関連するセグメンテーション作業も役立ちます: DeepLabv3+は、エンコーダー-デコーダーとatrous畳み込みで境界を洗練します (PDF); Mask R-CNNは、インスタンスごとのマスクを提供します (PDF); そして SAM(Segment Anything)は、 なじみのない画像に対してゼロショットマスクを生成するプロンプト可能な基盤モデルです。
学術研究では、Composition-1Kに関するSAD、MSE、Gradient、およびConnectivityエラーが報告されています。モデルを選択する場合は、これらのメトリックを探してください (メトリックの定義; Background Mattingのメトリックセクション)。 ポートレート/ビデオの場合、MODNetと Background Matting V2は強力です。一般的な「顕著なオブジェクト」画像の場合、 U2-Netは堅実なベースラインです。困難な透明度の場合、 FBAはよりクリーンになる可能性があります。
PlayStation 2 (PS2) は、独自のハードウェアアーキテクチャ用に最適化された独自の画像フォーマットを使用しています。このフォーマットは、PS2 のグラフィックスシンセサイザーとベクターユニットを活用して、2D グラフィックスの効率的な格納とレンダリングを可能にします。画像は、視覚的な品質とメモリ使用量のバランスを取るために、さまざまなカラーモード、圧縮技術、データレイアウトを使用して格納されます。
PS2 画像に使用される主なカラーモードは、32 ビット RGBA、24 ビット RGB、16 ビット RGB (565 または 5551)、および CLUT (カラー参照テーブル) を使用した 4 ビットまたは 8 ビットのインデックスカラーです。32 ビット RGBA は、透明度のための アルファチャンネルを備えた最高品質を提供しますが、4 ビットのインデックスは、より小さなファイルサイズのために品質を犠牲にします。16 ビット RGB モードは、中間のバランスを取ります。選択したカラーモードは、メモリ使用量とグラフィックスの可能な最大詳細とカラー深度に影響します。
PS2 グラフィックスは、オプションでインデックスカラーモードにパレットを使用できます。パレットまたは CLUT は、4 ビットまたは 8 ビットのインデックス値を 16 ビットまたは 24 ビットの RGB カラーにマッピングするテーブルです。パレットを使用すると、直接カラーモードと比較して、より視覚的にリッチなグラフィックスをより少ないメモリフットプリントで実現できますが、画像ごとに 16 または 256 の固有の色に限定されるというトレードオフがあります。パレットは、2D スプライト、テキスト、UI 要素などのより単純なグラフィックスに最適です。
限られたメモリを節約するために、PS2 画像データを圧縮するためにいくつかの手法が使用されています。最も単純なのは、同一の値の繰り返しシーケンスをカウントと値自体に置き換えるランレングスエンコーディング (RLE) です。たとえば、「AAAAAAABBCCCCCC」は「7A2B6C」に圧縮されます。このロスレスアルゴリズムは高速で、同じ色の連続した実行が多数ある画像の圧縮に効果的です。
より高度な PS2 画像圧縮方法は、人間の視覚システムの特性を利用して、知覚できない情報を破棄します。これらのロスアルゴリズムは、画像ブロックを分析し、より高い周波数データと、目が敏感でない色の精度を選択的に破棄します。PS2 ハードウェアは、ベク ターユニットに合わせて調整されたベクトル量子化とブロック切断符号化の形式をネイティブにサポートしています。圧縮された画像データを CLUT パレットとペアリングすることで、詳細なグラフィックスを効率的に格納してレンダリングできます。
PS2 グラフィックスパイプラインは、テクスチャ付きの三角形の描画に基づいています。3D サーフェスにマッピングされることを目的とした画像は、2D テクスチャとして格納されます。テクスチャがサーフェスにどのようにサンプリング、フィルタリング、適用されるかを制御するために、PS2 テクスチャにはミップマップが含まれます。これらは、テクスチャ付きのサーフェスが斜めの角度または遠くから見られたときにアーティファクトを低減する、フルサイズのテクスチャの事前に計算された縮小バージョンです。単一の PS2 テクスチャは、フルサイズの画像の後に、連続的に縮小されたミップマップのシーケンスで構成されます。
PS2 グラフィックスデータは、ハードウェアが画像ピクセルに効率的にアクセスできるように、メモリ内に独自の方法でレイアウトされています。カラーデータは、別々のビットプレーンに分割したり、VRAM 内のスイズルパターンに格納したりできます。レンダリングパフォーマンスを最大化するには、データがどのように配置されているかを慎重に検討する必要があります。グラフィックスシンセサイザーは、これらの特殊なデータレイアウト規則に従う画像とテクスチャをレンダリングするように最適化されています。
画像データ自体だけでなく、PS2 グラフィックスは頻繁に付随するメタデータに依存しています。スプライトの場合、これには位置、スケール、回転、アルファブレンドモードなどのプロパティが含まれます。3D テクスチャの場合、メタデータは、寸法、カラーモード、圧縮、ミップマップレベルの数、テクスチャラッピングとクランプルール、テクスチャフィルタリングモードなどの詳細を指定します。このメタデータは、PS2 に画像の処理方法と適用方法を指示します。
このコンバーターはブラウザ内で完全に動作します。ファイルを選択すると、メモリに読み込まれ、選択したフォーマットに変換されます。その後、変換されたファイルをダウンロードできます。
変換は瞬時に開始され、ほとんどのファイルは1秒以内に変換されます。大きなファイルの場合、時間がかかる場合があります。
ファイルは決してサーバにアップロードされません。ブラウザ内で変換され、変換されたファイルがダウンロードされます。ファイルは見られません。
画像フォーマット間の変換すべてに対応しています。JPEG、PNG、GIF、WebP、SVG、BMP、TIFFなどです。
このコンバーターは完全に無料で、永久に無料のままです。ブラウザ内で動作するため、サーバを用意する必要がないので、料金を請求する必要がありません。
はい、一度に複数のファイルを変換できます。追加時に複数のファイルを選択してください。