Usuwanie tła oddziela obiekt od otoczenia, dzięki czemu można go umieścić na przezroczystości, zamienić scenę lub wkomponować w nowy projekt. Pod maską szacujesz maskę alfa — nieprzezroczystość na piksel od 0 do 1 — a następnie komponujesz pierwszy plan z użyciem kanału alfa na czymś innym. To jest matematyka z Porter–Duff i przyczyna typowych pułapek, takich jak „frędzle” i alfa prosta a premultiplikowana. Praktyczne wskazówki dotyczące premultiplikacji i koloru liniowego można znaleźć w notatkach Win2D firmy Microsoft, Sørena Sandmanna i opracowaniu Lomonta na temat mieszania liniowego.
Jeśli możesz kontrolować przechwytywanie, pomaluj tło na jednolity kolor (często zielony) i wyklucz ten odcień. Jest to szybkie, sprawdzone w filmie i telewizji oraz idealne do wideo. Kompromisy to oświetlenie i garderoba: kolorowe światło rozlewa się na krawędzie (zwłaszcza włosy), więc użyjesz narzędzi do usuwania rozlania, aby zneutralizować zanieczyszczenie. Dobre wprowadzenia obejmują dokumentację Nuke, Mixing Light i praktyczne demo Fusion.
W przypadku pojedynczych obrazów z nieuporządkowanym tłem, algorytmy interaktywne potrzebują kilku wskazówek od użytkownika — np. luźnego prostokąta lub gryzmołów — i tworzą ostrą maskę. Kanoniczną metodą jest GrabCut (rozdział książki), który uczy się modeli kolorów dla pierwszego planu/tła i iteracyjnie wykorzystuje cięcia grafowe do ich rozdzielenia. Podobne pomysły zobaczysz w Zaznaczaniu pierwszego planu w GIMP opartym na SIOX (wtyczka ImageJ).
Matowanie rozwiązuje problem częściowej przezroczystości na delikatnych granicach (włosy, futro, dym, szkło). Klasyczne matowanie w formie zamkniętej przyjmuje trimapę (zdecydowanie-pierwszy plan/zdecydowanie-tło/nieznane) i rozwiązuje układ liniowy dla alfy z dużą dokładnością krawędzi. Nowoczesne głębokie matowanie obrazu uczy sieci neuronowe na zbiorze danych Adobe Composition-1K (dokumentacja MMEditing) i jest oceniane za pomocą metryk takich jak SAD, MSE, Gradient i Connectivity (wyjaśnienie benchmarku).
Powiązane prace nad segmentacją są również przydatne: DeepLabv3+ udoskonala granice za pomocą kodera-dekodera i splotów atrous (PDF); Mask R-CNN generuje maski dla poszczególnych instancji (PDF); a SAM (Segment Anything) to sterowany promptami model podstawowy, który generuje maski w trybie zero-shot na nieznanych obrazach.
Prace akademickie raportują błędy SAD, MSE, Gradient i Connectivity na Composition-1K. Jeśli wybierasz model, szukaj tych metryk (definicje metryk; sekcja metryk Background Matting). W przypadku portretów/wideo MODNet i Background Matting V2 są skuteczne; w przypadku ogólnych obrazów „obiektów wyróżniających się”, U2-Net jest solidną podstawą; w przypadku trudnej przezroczystości FBA daje lepsze rezultaty.
PlayStation 2 (PS2) wykorzystuje zastrzeżony format obrazu zoptymalizowany pod kątem jego unikalnej architektury sprzętowej. Format ten wykorzystuje syntezator grafiki i jednostki wektorowe PS2, aby umożliwić wydajne przechowywanie i renderowanie grafiki 2D. Obrazy są przechowywane przy użyciu różnych trybów kolorów, technik kompresji i układów danych, aby zrównoważyć jakość wizualną i wykorzystanie pamięci.
Głównymi trybami kolorów używanymi w obrazach PS2 są 32-bitowy RGBA, 24-bitowy RGB, 16-bitowy RGB (565 lub 5551) oraz 4-bitowy lub 8-bitowy indeksowany kolor z CLUT (tablicą kolorów). 32-bitowy RGBA zapewnia najwyższą jakość z kanałem alfa dla przezroczystości, podczas gdy 4-bitowy indeksowany poświęca jakość na rzecz mniejszego rozmiaru pliku. Tryby 16-bitowego RGB stanowią kompromis. Wybrany tryb kolorów wpływa na wykorzystanie pamięci oraz maksymalną możliwą szczegółowość i głębię kolorów grafiki.
Grafika PS2 może opcjonalnie używać palet dla indeksowanych trybów kolorów. Paleta lub CLUT to tabela mapująca 4-bitowe lub 8-bitowe wartości indeksów na 16-bitowe lub 24-bitowe kolory RGB. Używanie palet umożliwia uzyskanie bardziej wizualnie bogatej grafiki przy mniejszym zapotrzebowaniu na pamięć w porównaniu z bezpośrednimi trybami kolorów, ale wiąże się to z ograniczeniem do zaledwie 16 lub 256 unikalnych kolorów na obraz. Palety najlepiej nadają się do prostszej grafiki, takiej jak sprite'y 2D, tekst i elementy interfejsu użytkownika.
Do kompresji danych obrazu PS2 stosuje się kilka technik w celu oszczędzania ograniczonej pamięci. Najprostszą z nich jest kodowanie długości przebiegu (RLE), które zastępuje powtarzające się sekwencje identycznych wartości liczbą i samą wartością. Na przykład „AAAAAAABBCCCCCC” zostałoby skompresowane do „7A2B6C”. Ten bezstratny algorytm jest szybki i skuteczny w kompresji obrazów z wieloma sąsiadującymi przebiegami tego samego koloru.
Bardziej zaawansowane metody kompresji obrazu PS2 wykorzystują właściwości ludzkiego układu wzrokowego, aby odrzucić niezauważalne informacje. Te stratne algorytmy analizują bloki obrazu i selektywnie odrzucają dane o wyższej częstotliwości i precyzji kolorów, na które oko jest mniej wrażliwe. Sprzęt PS2 natywnie obsługuje formę kwantyzacji wektorowej i kodowania obcinania bloków dostosowanego do jego jednostek wektorowych. Poprzez połączenie skompresowanych danych obrazu z paletami CLUT można wydajnie przechowywać i renderować szczegółową grafikę.
Kanał graficzny PS2 opiera się na rysowaniu teksturowanych trójkątów. Obrazy przeznaczone do mapowania na powierzchnie 3D są przechowywane jako tekstury 2D. Aby kontrolować sposób próbkowania, filtrowania i nakładania tekstur na powierzchnie, tekstury PS2 zawierają mipmapy. Są to wstępnie obliczone, pomniejszone wersje tekstury w pełnym rozmiarze, które redukują artefakty, gdy teksturowana powierzchnia jest oglądana pod kątem lub z odległości. Pojedyncza tekstura PS2 składa się z obrazu w pełnym rozmiarze, a następnie z sekwencji kolejnych pomniejszonych mipmap.
Dane graficzne PS2 są układane w pamięci w unikalny sposób, aby umożliwić sprzętowi wydajny dostęp do pikseli obrazu. Dane kolorów mogą być dzielone na oddzielne bitplany lub przechowywane w splecionych wzorach w pamięci VRAM. Aby zmaksymalizować wydajność renderowania, konieczne jest dokładne rozważenie sposobu rozmieszczenia danych. Syntezator grafiki jest zoptymalizowany do renderowania obrazów i tekstur, które są zgodne z tymi specjalistycznymi konwencjami układu danych.
Oprócz samych danych obrazu grafika PS2 często polega na towarzyszących metadanych. W przypadku sprite'ów obejmuje to właściwości takie jak pozycja, skala, obrót i tryb mieszania alfa. W przypadku tekstur 3D metadane określają szczegóły, takie jak wymiary, tryb kolorów, kompresja, liczba poziomów mipmap, zasady zawijania i zaciskania tekstury oraz tryb filtrowania tekstury. Te metadane instruują PS2, jak przetwarzać i stosować obrazy.
Ten konwerter działa całkowicie w Twojej przeglądarce. Kiedy wybierasz plik, jest on wczytywany do pamięci i konwertowany na wybrany format. Następnie możesz pobrać skonwertowany plik.
Konwersje zaczynają się natychmiast, a większość plików jest konwertowana w mniej niż sekundę. Większe pliki mogą wymagać więcej czasu.
Twoje pliki nigdy nie są przesyłane na nasze serwery. Są konwertowane w Twojej przeglądarce, a następnie pobierany jest skonwertowany plik. Nigdy nie widzimy Twoich plików.
Obsługujemy konwersję między wszystkimi formatami obrazów, w tym JPEG, PNG, GIF, WebP, SVG, BMP, TIFF i więcej.
Ten konwerter jest całkowicie darmowy i zawsze będzie darmowy. Ponieważ działa w Twojej przeglądarce, nie musimy płacić za serwery, więc nie musimy Cię obciążać opłatami.
Tak! Możesz konwertowa ć tyle plików, ile chcesz na raz. Wystarczy wybrać wiele plików podczas ich dodawania.