Hintergrundentfernung trennt ein Motiv von seiner Umgebung, sodass Sie es auf Transparenz platzieren, die Szene austauschen oder es in ein neues Design komponieren können. Unter der Haube schätzen Sie eine Alpha-Matte – eine pro-Pixel-Deckkraft von 0 bis 1 – und dann den Vordergrund mittels Alpha-Compositing über etwas anderem legen. Dies ist die Mathematik von Porter–Duff und die Ursache für typische Fallstricke wie „Ränder“ und gerades vs. vormultipliziertes Alpha. Praktische Anleitungen zur Vormultiplikation und linearen Farbe finden Sie in Microsofts Win2D-Notizen, Søren Sandmann und Lomonts Beitrag zum linearen Blending.
Wenn Sie die Aufnahme steuern können, malen Sie den Hintergrund in einer Volltonfarbe (oft grün) und keyen Sie diesen Farbton aus. Es ist schnell, in Film und Fernsehen bewährt und ideal für Videos. Die Kompromisse sind Beleuchtung und Garderobe: farbiges Licht schwappt auf die Ränder (besonders Haare), daher verwenden Sie Despill-Werkzeuge, um die Kontamination zu neutralisieren. Gute Einführungen umfassen Nukes Dokumentation, Mixing Light und eine praktische Fusion-Demo.
Bei Einzelbildern mit unordentlichen Hintergründen benötigen interaktive Algorithmen einige Benutzerhinweise – z. B. ein lockeres Rechteck oder Kritzeleien – und erzeugen eine scharfe Maske. Die kanonische Methode ist GrabCut (Buchkapitel), das Farbmodelle für Vordergrund/Hintergrund lernt und Graphenschnitte iterativ verwendet, um sie zu trennen. Ähnliche Ideen finden Sie in GIMPs Vordergrundauswahl basierend auf SIOX (ImageJ-Plugin).
Matting löst die fraktionierte Transparenz an feinen Grenzen (Haare, Fell, Rauch, Glas). Klassisches Closed-Form-Matting nimmt eine Trimap (eindeutig-Vordergrund/eindeutig-Hintergrund/unbekannt) und löst ein lineares System für Alpha mit starker Kantentreue. Modernes Deep Image Matting trainiert neuronale Netze auf dem Adobe Composition-1K-Datensatz (MMEditing-Dokumentation) und wird mit Metriken wie SAD, MSE, Gradient und Konnektivität bewertet (Benchmark-Erklärung).
Verwandte Segmentierungsarbeiten sind ebenfalls nützlich: DeepLabv3+ verfeinert Grenzen mit einem Encoder-Decoder und atrousen Faltungen (PDF); Mask R-CNN liefert instanzspezifische Masken (PDF); und SAM (Segment Anything) ist ein durch Prompts steuerbares Grundlagenmodell, das Zero-Shot-Masken auf unbekannten Bildern erzeugt.
Akademische Arbeiten berichten über SAD-, MSE-, Gradienten- und Konnektivitäts-Fehler auf Composition-1K. Wenn Sie ein Modell auswählen, suchen Sie nach diesen Metriken (Metrikdefinitionen; Metrikabschnitt von Background Matting). Für Porträts/Videos sind MODNet und Background Matting V2 leistungsstark; für allgemeine „saliente Objekt“-Bilder ist U2-Net eine solide Grundlage; für schwierige Transparenz kann FBA sauberer sein.
JPEG, was für Joint Photographic Experts Group steht, ist eine häufig verwendete Methode der verlustbehafteten Kompression für digitale Bilder, insbesondere für Bilder, die mit digitaler Fotografie aufgenommen wurden. Der Kompressionsgrad kann angepasst werden, um einen wählbaren Kompromiss zwischen Dateigröße und Bildqualität zu erreichen. JPEG erreicht in der Regel eine Kompression von 10:1 bei nur geringem wahrnehmbarem Qualitätsverlust.
Der JPEG-Kompressionsalgorithmus ist der Kern des JPEG-Standards. Der Prozess beginnt damit, dass ein digitales Bild von seinem üblichen RGB-Farbraum in einen anderen Farbraum namens YCbCr konvertiert wird. Der YCbCr-Farbraum teilt das Bild in Luminanz (Y), welche die Helligkeitsstufen darstellt, und Chrominanz (Cb und Cr), welche die Farbinformationen darstellen. Diese Trennung ist vorteilhaft, da das menschliche Auge empfindlicher auf Helligkeitsunterschiede als auf Farbunterschiede reagiert, was es der Kompression ermöglicht, Farbinformationen stärker zu komprimieren als Luminanz.
Nachdem das Bild im YCbCr-Farbraum vorliegt, ist der nächste Schritt in der JPEG-Kompression das Downsampling der Chrominanzkanäle. Downsampling reduziert die Auflösung der Chrominanzinformationen, was die wahrgenommene Bildqualität in der Regel nicht wesentlich beeinträchtigt, da das menschliche Auge weniger empfindlich auf Farbdetails ist. Dieser Schritt ist optional und kann je nach gewünschtem Gleichgewicht zwischen Bildqualität und Dateigröße angepasst werden.
Nach dem Downsampling wird das Bild in Blöcke, normalerweise mit einer Größe von 8x8 Pixeln, unterteilt. Jeder Block wird dann separat verarbeitet. Der erste Schritt bei der Verarbeitung jedes Blocks ist die Anwendung der Diskreten Kosinustransformation (DCT). Die DCT ist eine mathematische Operation, die die Daten aus dem räumlichen Bereich (die Pixelwerte) in den Frequenzbereich transformiert. Das Ergebnis ist eine Matrix von Frequenzkoeffizienten, die die Bilddaten des Blocks in Bezug auf seine räumlichen Frequenzkomponenten darstellen.
Die aus der DCT resultierenden Frequenzkoeffizienten werden dann quantisiert. Quantisierung ist der Prozess, bei dem eine große Menge an Eingangswerten auf eine kleinere Menge abgebildet wird – im Falle von JPEG bedeutet dies, die Genauigkeit der Frequenzkoeffizienten zu reduzieren. Hier tritt der verlustbehaftete Teil der Kompression auf, da einige Bildinformationen verworfen werden. Der Quantisierungsschritt wird durch eine Quantisierungstabelle gesteuert, die bestimmt, wie viel Kompression auf jede Frequenzkomponente angewendet wird. Die Quantisierungstabellen können angepasst werden, um eine höhere Bildqualität (weniger Kompression) oder eine kleinere Dateigröße (mehr Kompression) zu begünstigen.
Nach der Quantisierung werden die Koeffizienten in einer Zick-Zack-Anordnung angeordnet, beginnend in der oberen linken Ecke und einem Muster folgend, das niedrigere Frequenzkomponenten gegenüber höheren Frequenzkomponenten priorisiert. Dies liegt daran, dass niedrigere Frequenzkomponenten (die die gleichmäßigeren Teile des Bildes darstellen) für das Gesamterscheinungsbild wichtiger sind als höhere Frequenzkomponenten (die die feineren Details und Kanten darstellen).
Der nächste Schritt im JPEG-Kompressionsprozess ist die Entropiekodierung, die eine Methode der verlustfreien Kompression ist. Die am häufigsten in JPEG verwendete Form der Entropiekodierung ist die Huffman-Kodierung, wobei auch die arithmetische Kodierung eine Option ist. Die Huffman-Kodierung funktioniert, indem sie kürzere Codes für häufigere Vorkommen und längere Codes für seltener vorkommende Werte zuweist. Da die Zick-Zack-Anordnung dazu neigt, ähnliche Frequenzkoeffizienten zusammenzufassen, erhöht sie die Effizienz der Huffman-Kodierung.
Sobald die Entropiekodierung abgeschlossen ist, wird die komprimierte Daten in ein Dateiformat gespeichert, das dem JPEG-Standard entspricht. Dieses Dateiformat enthält einen Kopf mit Informationen zum Bild, wie z.B. seine Abmessungen und die verwendeten Quantisierungstabellen, gefolgt von den Huffman-kodierten Bilddaten. Das Dateiformat unterstützt auch die Aufnahme von Metadaten wie EXIF-Daten, die Informationen über die Kameraeinstellungen, das Aufnahmedatum und -uhrzeit und andere relevante Details enthalten können.
Wenn ein JPEG-Bild geöffnet wird, kehrt der Dekompressionsvorgang die Kompressionsschritte im Wesentlichen um. Die Huffman-kodierten Daten werden dekodiert, die quantisierten Frequenzkoeffizienten werden unter Verwendung derselben Quantisierungstabellen, die auch bei der Kompression verwendet wurden, re-quantisiert, und die inverse Diskrete Kosinustransformation (IDCT) wird auf jeden Block angewendet, um die Frequenzbereichsdaten wieder in räumliche Pixelwerte umzuwandeln.
Der Re-Quantisierungs- und IDCT-Prozess führen aufgrund der verlustbehafteten Natur der Kompression zu einigen Fehlern, weshalb JPEG nicht ideal für Bilder ist, die mehrmals bearbeitet und erneut gespeichert werden. Jedes Mal, wenn ein JPEG-Bild gespeichert wird, durchläuft es den Kompressionsprozess erneut, und es gehen weitere Bildinformationen verloren. Dies kann zu einer deutlichen Verschlechterung der Bildqualität im Laufe der Zeit führen, ein Phänomen, das als 'Generationsverlust' bezeichnet wird.
Trotz der verlustbehafteten Natur der JPEG-Kompression bleibt es ein beliebtes Bildformat aufgrund seiner Flexibilität und Effizienz. JPEG-Bilder können sehr klein in der Dateigröße sein, was sie ideal für die Verwendung im Web macht, wo Bandbreite und Ladezeiten wichtige Überlegungen sind. Darüber hinaus enthält der JPEG-Standard einen progressiven Modus, mit dem ein Bild so codiert werden kann, dass es in mehreren Durchgängen decodiert werden kann, wobei sich die Auflösung des Bildes mit jedem Durchgang verbessert. Dies ist insbesondere für Webbilder nützlich, da es die schnelle Anzeige einer niederqualitativeren Version des Bildes ermöglicht, wobei die Qualität zunimmt, je mehr Daten heruntergeladen werden.
JPEG hat auch einige Einschränkungen und ist nicht immer die beste Wahl für alle Arten von Bildern. Zum Beispiel ist es nicht gut geeignet für Bilder mit scharfen Kanten oder hochkontrasten Text, da die Kompression in diesen Bereichen sichtbare Artefakte verursachen kann. Außerdem unterstützt JPEG keine Transparenz, die ein Feature von anderen Formaten wie PNG und GIF ist.
Um einige der Einschränkungen des ursprünglichen JPEG-Standards zu adressieren, wurden neue Formate wie JPEG 2000 und JPEG XR entwickelt. Diese Formate bieten eine verbesserte Kompressionseffizienz, Unterstützung für höhere Bittiefe und zusätzliche Funktionen wie Transparenz und verlustfreie Kompression. Sie haben jedoch noch nicht den gleichen Grad an allgemeiner Verbreitung wie das ursprüngliche JPEG-Format erreicht.
Zusammenfassend ist das JPEG-Bildformat ein komplexer Ausgleich zwischen Mathematik, menschlicher Wahrnehmungspsychologie und Computerwissenschaften. Seine weite Verbreitung ist ein Beweis für seine Effektivität bei der Reduzierung der Dateigröße bei gleichzeitiger Beibehaltung eines Qualitätsniveaus, das für die meisten Anwendungen akzeptabel ist. Das Verständnis der technischen Aspekte von JPEG kann Anwender dabei unterstützen, fundierte Entscheidungen darüber zu treffen, wann dieses Format verwendet werden soll und wie ihre Bilder für das für ihre Bedürfnisse am besten geeignete Gleichgewicht aus Qualität und Dateigröße optimiert werden können.
Dieser Konverter läuft vollständig in Ihrem Browser. Wenn Sie eine Datei auswählen, wird sie in den Speicher gelesen und in das ausgewählte Format konvertiert. Sie können die konvertierte Datei dann herunterladen.
Die Konvertierung beginnt sofort, und die meisten Dateien werden in weniger als einer Sekunde konvertiert. Größere Dateien können länger dauern.
Ihre Dateien werden niemals auf unsere Server hochgeladen. Sie werden in Ihrem Browser konvertiert, und die konvertierte Datei wird dann heruntergeladen. Wir sehen Ihre Dateien niemals.
Wir unterstützen die Konvertierung zwischen allen Bildformaten, einschließlich JPEG, PNG, GIF, WebP, SVG, BMP, TIFF und mehr.
Dieser Konverter ist völlig kostenlos und wird immer kostenlos sein. Da er in Ihrem Browser läuft, müssen wir nicht für Server bezahlen, also müssen wir Ihnen auch nichts berechnen.
Ja! Sie können so viele Dateien auf einmal konvertieren, wie Sie möchten. Wählen Sie einfach mehrere Dateien aus, wenn Sie sie hinzufügen.