La rimozione dello sfondo separa un soggetto dai suoi dintorni in modo da poterlo posizionare su trasparenza, scambiare la scena o comporla in un nuovo design. Sotto il cofano stai stimando un alpha matte—un'opacità per pixel da 0 a 1—e poi applicando il compositing alfa al primo piano su qualcos'altro. Questa è la matematica di Porter–Duff e la causa di problemi comuni come “frange” e alfa dritto vs. premoltiplicato. Per una guida pratica sulla premoltiplicazione e il colore lineare, vedere le note Win2D di Microsoft, Søren Sandmann, e l'articolo di Lomont sulla fusione lineare.
Se puoi controllare l'acquisizione, dipingi lo sfondo di un colore a tinta unita (spesso verde) e elimina quella tonalità. È veloce, ampiamente testato nel cinema e nelle trasmissioni, e ideale per i video. I compromessi sono l'illuminazione e l'abbigliamento: la luce colorata si riversa sui bordi (specialmente i capelli), quindi userai strumenti di despill per neutralizzare la contaminazione. Buone guide introduttive includono la documentazione di Nuke, Mixing Light, e una demo pratica di Fusion.
Per singole immagini con sfondi disordinati, gli algoritmi interattivi necessitano di alcuni suggerimenti dell'utente, ad esempio un rettangolo approssimativo o scarabocchi, e generano una maschera nitida. Il metodo canonico è GrabCut (capitolo del libro), che apprende modelli di colore per primo piano/sfondo e utilizza tagli di grafo in modo iterativo per separarli. Vedrai idee simili in Selezione primo piano di GIMP basato su SIOX (plugin ImageJ).
Il Matting risolve la trasparenza parziale ai confini sottili (capelli, pelliccia, fumo, vetro). Il matting a forma chiusa classico prende una trimappa (decisamente-primo piano/decisamente-sfondo/sconosciuto) e risolve un sistema lineare per l'alfa con una forte precisione dei bordi. Il deep image matting moderno addestra reti neurali sul dataset Adobe Composition-1K (documentazione MMEditing), ed è valutato con metriche come SAD, MSE, Gradiente e Connettività (spiegazione del benchmark).
Anche il lavoro di segmentazione correlato è utile: DeepLabv3+ affina i confini con un codificatore-decodificatore e convoluzioni dilatate (PDF); Mask R-CNN fornisce maschere per istanza (PDF); e SAM (Segment Anything) è un modello di base controllabile da prompt che genera maschere zero-shot su immagini sconosciute.
Il lavoro accademico riporta errori di SAD, MSE, Gradiente e Connettività su Composition-1K. Se stai scegliendo un modello, cerca quelle metriche (definizioni delle metriche; sezione metriche di Background Matting). Per ritratti/video, MODNet e Background Matting V2 sono molto efficaci; per immagini generiche di “oggetti salienti”, U2-Net è una solida base; per trasparenze difficili, FBA può dare risultati migliori.
La PlayStation 2 (PS2) utilizza un formato di immagine proprietario ottimizzato per la sua esclusiva architettura hardware. Il formato sfrutta il Graphics Synthesizer e le Vector Units della PS2 per consentire un'archiviazione e un rendering efficienti della grafica 2D. Le immagini vengono archiviate utilizzando diverse modalità colore, tecniche di compressione e layout di dati per bilanciare la qualità visiva e l'utilizzo della memoria.
Le principali modalità colore utilizzate per le immagini PS2 sono RGBA a 32 bit, RGB a 24 bit, RGB a 16 bit (565 o 5551) e colore indicizzato a 4 o 8 bit con una CLUT (Color Look-Up Table). RGBA a 32 bit offre la massima qualità con un canale alfa per la trasparenza, mentre l'indicizzato a 4 bit sacrifica la qualità per una dimensione del file più piccola. Le modalità RGB a 16 bit rappresentano una via di mezzo. La modalità colore scelta influisce sull'utilizzo della memoria e sui massimi dettagli e profondità di colore possibili della grafica.
La grafica PS2 può facoltativamente utilizzare tavolozze per le modalità colore indicizzate. Una tavolozza o CLUT è una tabella che mappa i valori di indice a 4 o 8 bit a colori RGB a 16 o 24 bit. L'utilizzo di tavolozze consente una grafica visivamente più ricca con un ingombro di memoria inferiore rispetto alle modalità colore diretto, ma con lo svantaggio di essere limitato a soli 16 o 256 colori univoci per immagine. Le tavolozze sono più adatte per una grafica più semplice come sprite 2D, testo ed elementi dell'interfaccia utente.
Vengono utilizzate diverse tecniche per comprimere i dati delle immagini PS2 per risparmiare memoria limitata. La più semplice è la codifica Run-Length (RLE), che sostituisce sequenze ripetute di valori identici con un conteggio e il valore stesso. Ad esempio, "AAAAAAABBCCCCCC" verrebbe compresso in "7A2B6C". Questo algoritmo senza perdita di dati è veloce ed efficace nella compressione di immagini con molte sequenze contigue dello stesso colore.
Metodi di compressione delle immagini PS2 più avanzati sfruttano le proprietà del sistema visivo umano per scartare informazioni impercettibili. Questi algoritmi con perdita analizzano i blocchi di immagini e scartano selettivamente i dati a frequenza più alta e la precisione del colore a cui l'occhio è meno sensibile. L'hardware PS2 supporta nativamente una forma di quantizzazione vettoriale e codifica a troncamento di blocco su misura per le sue Vector Units. Accoppiando i dati delle immagini compresse con le tavolozze CLUT, è possibile archiviare e rendere in modo efficiente una grafica dettagliata.
La pipeline grafica PS2 si basa sul disegno di triangoli texturizzati. Le immagini destinate a essere mappate su superfici 3D vengono archiviate come texture 2D. Per controllare come le texture vengono campionate, filtrate e applicate alle superfici, le texture PS2 includono mipmap. Queste sono versioni ridimensionate e precalcolate della texture a grandezza naturale che riducono gli artefatti quando una superficie texturizzata viene visualizzata ad angoli obliqui o a distanza. Una singola texture PS2 è costituita dall'immagine a grandezza naturale seguita da una sequenza di mipmap ridimensionati in successione.
I dati grafici PS2 sono disposti in memoria in modi univoci per consentire all'hardware di accedere in modo efficiente ai pixel delle immagini. I dati di colore possono essere suddivisi in bitplane separati o archiviati in schemi swizzled nella VRAM. È necessario considerare attentamente come vengono organizzati i dati per massimizzare le prestazioni di rendering. Il Graphics Synthesizer è ottimizzato per il rendering di immagini e texture che seguono queste convenzioni di layout dati specializzate.
Oltre ai dati dell'immagine stessa, la grafica PS2 si basa spesso su metadati di accompagnamento. Per gli sprite, ciò include proprietà come posizione, scala, rotazione e modalità di fusione alfa. Per le texture 3D, i metadati specificano dettagli come dimensioni, modalità colore, compressione, numero di livelli di mipmap, regole di avvolgimento e aggancio della texture e modalità di filtro della texture. Questi metadati indicano alla PS2 come elaborare e applicare le immagini.
Questo convertitore funziona interamente nel tuo browser. Quando selezioni un file, viene letto in memoria e convertito nel formato selezionato. Puoi quindi scaricare il file convertito.
Le conversioni iniziano istantaneamente e la maggior parte dei file viene convertita in meno di un secondo. I file più grandi potrebbero richiedere più tempo.
I tuoi file non vengono mai caricati sui nostri server. Vengono convertiti nel tuo browser e il file convertito viene quindi scaricato. Non vediamo mai i tuoi file.
Supportiamo la conversione tra tutti i formati di immagine, inclusi JPEG, PNG, GIF, WebP, SVG, BMP, TIFF e altro ancora.
Questo convertitore è completamente gratuito e lo sarà sempre. Poiché funziona nel tuo browser, non dobbiamo pagare per i server, quindi non dobbiamo addebitarti alcun costo.
Sì! Puoi convertire tutti i file che vuoi in una volta. Basta selezionare più file quando li aggiungi.