La rimozione dello sfondo separa un soggetto dai suoi dintorni in modo da poterlo posizionare su trasparenza, scambiare la scena o comporla in un nuovo design. Sotto il cofano stai stimando un alpha matte—un'opacità per pixel da 0 a 1—e poi applicando il compositing alfa al primo piano su qualcos'altro. Questa è la matematica di Porter–Duff e la causa di problemi comuni come “frange” e alfa dritto vs. premoltiplicato. Per una guida pratica sulla premoltiplicazione e il colore lineare, vedere le note Win2D di Microsoft, Søren Sandmann, e l'articolo di Lomont sulla fusione lineare.
Se puoi controllare l'acquisizione, dipingi lo sfondo di un colore a tinta unita (spesso verde) e elimina quella tonalità. È veloce, ampiamente testato nel cinema e nelle trasmissioni, e ideale per i video. I compromessi sono l'illuminazione e l'abbigliamento: la luce colorata si riversa sui bordi (specialmente i capelli), quindi userai strumenti di despill per neutralizzare la contaminazione. Buone guide introduttive includono la documentazione di Nuke, Mixing Light, e una demo pratica di Fusion.
Per singole immagini con sfondi disordinati, gli algoritmi interattivi necessitano di alcuni suggerimenti dell'utente, ad esempio un rettangolo approssimativo o scarabocchi, e generano una maschera nitida. Il metodo canonico è GrabCut (capitolo del libro), che apprende modelli di colore per primo piano/sfondo e utilizza tagli di grafo in modo iterativo per separarli. Vedrai idee simili in Selezione primo piano di GIMP basato su SIOX (plugin ImageJ).
Il Matting risolve la trasparenza parziale ai confini sottili (capelli, pelliccia, fumo, vetro). Il matting a forma chiusa classico prende una trimappa (decisamente-primo piano/decisamente-sfondo/sconosciuto) e risolve un sistema lineare per l'alfa con una forte precisione dei bordi. Il deep image matting moderno addestra reti neurali sul dataset Adobe Composition-1K (documentazione MMEditing), ed è valutato con metriche come SAD, MSE, Gradiente e Connettività (spiegazione del benchmark).
Anche il lavoro di segmentazione correlato è utile: DeepLabv3+ affina i confini con un codificatore-decodificatore e convoluzioni dilatate (PDF); Mask R-CNN fornisce maschere per istanza (PDF); e SAM (Segment Anything) è un modello di base controllabile da prompt che genera maschere zero-shot su immagini sconosciute.
Il lavoro accademico riporta errori di SAD, MSE, Gradiente e Connettività su Composition-1K. Se stai scegliendo un modello, cerca quelle metriche (definizioni delle metriche; sezione metriche di Background Matting). Per ritratti/video, MODNet e Background Matting V2 sono molto efficaci; per immagini generiche di “oggetti salienti”, U2-Net è una solida base; per trasparenze difficili, FBA può dare risultati migliori.
Il formato immagine JPS, abbreviazione di JPEG Stereo, è un formato file utilizzato per memorizzare fotografie stereoscopiche scattate da fotocamere digitali o create da software di rendering 3D. Si tratta essenzialmente di una disposizione affiancata di due immagini JPEG all'interno di un singolo file che, se visualizzate tramite software o hardware appropriati, fornisce un effetto 3D. Questo formato è particolarmente utile per creare un'illusione di profondità nelle immagini, il che migliora l'esperienza visiva per gli utenti con sistemi di visualizzazione compatibili o occhiali 3D.
Il formato JPS sfrutta la consolidata tecnica di compressione JPEG (Joint Photographic Experts Group) per memorizzare le due immagini. JPEG è un metodo di compressione con perdita, il che significa che riduce le dimensioni del file scartando selettivamente le informazioni meno importanti, spesso senza una diminuzione evidente della qualità dell'immagine per l'occhio umano. Ciò rende i file JPS relativamente piccoli e gestibili, nonostante contengano due immagini anziché una.
Un file JPS è essenzialmente un file JPEG con una struttura specifica. Contiene due immagini compresse JPEG affiancate all'interno di un singolo fotogramma. Queste immagini sono chiamate immagini dell'occhio sinistro e dell'occhio destro e rappresentano prospettive leggermente diverse della stessa scena, imitando la leggera differenza tra ciò che vede ciascuno dei nostri occhi. Questa differenza è ciò che consente la percezione della profondità quando le immagini vengono visualizzate correttamente.
La risoluzione standard per un'immagine JPS è in genere il doppio della larghezza di un'immagine JPEG standard per ospitare sia l'immagine di sinistra che quella di destra. Ad esempio, se un'immagine JPEG standard ha una risoluzione di 1920x1080 pixel, un'immagine JPS avrebbe una risoluzione di 3840x1080 pixel, con ciascuna immagine affiancata che occupa metà della larghezza totale. Tuttavia, la risoluzione può variare a seconda dell'origine dell'immagine e dell'uso previsto.
Per visualizzare un'immagine JPS in 3D, uno spettatore deve utilizzare un dispositivo di visualizzazione o un software compatibile in grado di interpretare le immagini affiancate e presentarle a ciascun occhio separatamente. Ciò può essere ottenuto attraverso vari metodi, come l'anaglifo 3D, in cui le immagini vengono filtrate per colore e visualizzate con occhiali colorati; 3D polarizzato, in cui le immagini vengono proiettate attraverso filtri polarizzati e visualizzate con occhiali polarizzati; o otturatore attivo 3D, in cui le immagini vengono visualizzate alternativamente e sincronizzate con occhiali otturatore che si aprono e chiudono rapidamente per mostrare a ciascun occhio l'immagine corretta.
La struttura del file di un'immagine JPS è simile a quella di un file JPEG standard. Contiene un'intestazione, che include il marcatore SOI (Start of Image), seguito da una serie di segmenti che contengono vari elementi di metadati e i dati dell'immagine stessa. I segmenti includono i marcatori APP (Application), che possono contenere informazioni come i metadati Exif, e il segmento DQT (Define Quantization Table), che definisce le tabelle di quantizzazione utilizzate per comprimere i dati dell'immagine.
Uno dei segmenti chiave in un file JPS è il segmento JFIF (JPEG File Interchange Format), che specifica che il file è conforme allo standard JFIF. Questo segmento è importante per garantire la compatibilità con un'ampia gamma di software e hardware. Include anche informazioni come il rapporto di aspetto e la risoluzione dell'immagine in miniatura, che può essere utilizzata per anteprime rapide.
I dati dell'immagine effettivi in un file JPS sono memorizzati nel segmento SOS (Start of Scan), che segue l'intestazione e i segmenti dei metadati. Questo segmento contiene i dati dell'immagine compressa sia per l'immagine di sinistra che per quella di destra. I dati vengono codificati utilizzando l'algoritmo di compressione JPEG, che prevede una serie di passaggi tra cui conversione dello spazio colore, sottocampionamento, trasformata discreta del coseno (DCT), quantizzazione e codifica dell'entropia.
La conversione dello spazio colore è il processo di conversione dei dati dell'immagine dallo spazio colore RGB, comunemente utilizzato nelle fotocamere digitali e nei display dei computer, allo spazio colore YCbCr, utilizzato nella compressione JPEG. Questa conversione separa l'immagine in un componente di luminanza (Y), che rappresenta i livelli di luminosità, e due componenti di crominanza (Cb e Cr), che rappresentano le informazioni sul colore. Ciò è vantaggioso per la compressione perché l'occhio umano è più sensibile ai cambiamenti di luminosità che di colore, consentendo una compressione più aggressiva dei componenti di crominanza senza influire in modo significativo sulla qualità dell'immagine percepita.
Il sottocampionamento è un processo che sfrutta la minore sensibilità dell'occhio umano ai dettagli del colore riducendo la risoluzione dei componenti di crominanza rispetto al componente di luminanza. I rapporti di sottocampionamento comuni includono 4:4:4 (nessun sottocampionamento), 4:2:2 (riducendo la risoluzione orizzontale della crominanza della metà) e 4:2:0 (riducendo sia la risoluzione orizzontale che verticale della crominanza della metà). La scelta del rapporto di sottocampionamento può influenzare l'equilibrio tra qualità dell'immagine e dimensioni del file.
La trasformata discreta del coseno (DCT) viene applicata a piccoli blocchi dell'immagine (in genere 8x8 pixel) per convertire i dati del dominio spaziale nel dominio della frequenza. Questo passaggio è cruciale per la compressione JPEG perché consente la separazione dei dettagli dell'immagine in componenti di varia importanza, con componenti a frequenza più alta spesso meno percepibili all'occhio umano. Questi componenti possono quindi essere quantizzati, o ridotti in precisione, per ottenere la compressione.
La quantizzazione è il processo di mappatura di un intervallo di valori su un singolo valore quantico, riducendo efficacemente la precisione dei coefficienti DCT. È qui che entra in gioco la natura con perdita della compressione JPEG, poiché alcune informazioni sull'immagine vengono scartate. Il grado di quantizzazione è determinato dalle tabelle di quantizzazione specificate nel segmento DQT e può essere regolato per bilanciare la qualità dell'immagine con le dimensioni del file.
Il passaggio finale nel processo di compressione JPEG è la codifica dell'entropia, che è una forma di compressione senza perdita. Il metodo più comune utilizzato in JPEG è la codifica Huffman, che assegna codici più brevi a valori più frequenti e codici più lunghi a valori meno frequenti. Ciò riduce le dimensioni complessive dei dati dell'immagine senza ulteriori perdite di informazioni.
Oltre alle tecniche di compressione JPEG standard, il formato JPS può anche includere metadati specifici relativi alla natura stereoscopica delle immagini. Questi metadati possono includere informazioni sulle impostazioni di parallasse, sui punti di convergenza e su qualsiasi altro dato che potrebbe essere necessario per visualizzare correttamente l'effetto 3D. Questi metadati sono in genere memorizzati nei segmenti APP del file.
Il formato JPS è supportato da una varietà di applicazioni software e dispositivi, tra cui televisori 3D, visori VR e visualizzatori di foto specializzati. Tuttavia, non è così ampiamente supportato come il formato JPEG standard, quindi gli utenti potrebbero dover utilizzare software specifici o convertire i file JPS in un altro formato per una compatibilità più ampia.
Una delle sfide con il formato JPS è garantire che le immagini di sinistra e di destra siano correttamente allineate e abbiano la parallasse corretta. Un disallineamento o una parallasse errata possono portare a un'esperienza visiva scomoda e possono causare affaticamento degli occhi o mal di testa. Pertanto, è importante per i fotografi e gli artisti 3D catturare o creare attentamente le immagini con i parametri stereoscopici corretti.
In conclusione, il formato immagine JPS è un formato file specializzato progettato per memorizzare e visualizzare immagini stereoscopiche. Si basa sulle consolidate tecniche di compressione JPEG per creare un modo compatto ed efficiente per memorizzare fotografie 3D. Sebbene offra un'esperienza visiva unica, il formato richiede hardware o software compatibili per visualizzare le immagini in 3D e può presentare sfide in termini di allineamento e parallasse. Nonostante queste sfide, il formato JPS rimane uno strumento prezioso per fotografi, artisti 3D e appassionati che desiderano catturare e condividere la profondità e il realismo del mondo in un formato digitale.
Questo convertitore funziona interamente nel tuo browser. Quando selezioni un file, viene letto in memoria e convertito nel formato selezionato. Puoi quindi scaricare il file convertito.
Le conversioni iniziano istantaneamente e la maggior parte dei file viene convertita in meno di un secondo. I file più grandi potrebbero richiedere più tempo.
I tuoi file non vengono mai caricati sui nostri server. Vengono convertiti nel tuo browser e il file convertito viene quindi scaricato. Non vediamo mai i tuoi file.
Supportiamo la conversione tra tutti i formati di immagine, inclusi JPEG, PNG, GIF, WebP, SVG, BMP, TIFF e altro ancora.
Questo convertitore è completamente gratuito e lo sarà sempre. Poiché funziona nel tuo browser, non dobbiamo pagare per i server, quindi non dobbiamo addebitarti alcun costo.
Sì! Puoi convertire tutti i file che vuoi in una volta. Basta selezionare più file quando li aggiungi.