La rimozione dello sfondo separa un soggetto dai suoi dintorni in modo da poterlo posizionare su trasparenza, scambiare la scena o comporla in un nuovo design. Sotto il cofano stai stimando un alpha matte—un'opacità per pixel da 0 a 1—e poi applicando il compositing alfa al primo piano su qualcos'altro. Questa è la matematica di Porter–Duff e la causa di problemi comuni come “frange” e alfa dritto vs. premoltiplicato. Per una guida pratica sulla premoltiplicazione e il colore lineare, vedere le note Win2D di Microsoft, Søren Sandmann, e l'articolo di Lomont sulla fusione lineare.
Se puoi controllare l'acquisizione, dipingi lo sfondo di un colore a tinta unita (spesso verde) e elimina quella tonalità. È veloce, ampiamente testato nel cinema e nelle trasmissioni, e ideale per i video. I compromessi sono l'illuminazione e l'abbigliamento: la luce colorata si riversa sui bordi (specialmente i capelli), quindi userai strumenti di despill per neutralizzare la contaminazione. Buone guide introduttive includono la documentazione di Nuke, Mixing Light, e una demo pratica di Fusion.
Per singole immagini con sfondi disordinati, gli algoritmi interattivi necessitano di alcuni suggerimenti dell'utente, ad esempio un rettangolo approssimativo o scarabocchi, e generano una maschera nitida. Il metodo canonico è GrabCut (capitolo del libro), che apprende modelli di colore per primo piano/sfondo e utilizza tagli di grafo in modo iterativo per separarli. Vedrai idee simili in Selezione primo piano di GIMP basato su SIOX (plugin ImageJ).
Il Matting risolve la trasparenza parziale ai confini sottili (capelli, pelliccia, fumo, vetro). Il matting a forma chiusa classico prende una trimappa (decisamente-primo piano/decisamente-sfondo/sconosciuto) e risolve un sistema lineare per l'alfa con una forte precisione dei bordi. Il deep image matting moderno addestra reti neurali sul dataset Adobe Composition-1K (documentazione MMEditing), ed è valutato con metriche come SAD, MSE, Gradiente e Connettività (spiegazione del benchmark).
Anche il lavoro di segmentazione correlato è utile: DeepLabv3+ affina i confini con un codificatore-decodificatore e convoluzioni dilatate (PDF); Mask R-CNN fornisce maschere per istanza (PDF); e SAM (Segment Anything) è un modello di base controllabile da prompt che genera maschere zero-shot su immagini sconosciute.
Il lavoro accademico riporta errori di SAD, MSE, Gradiente e Connettività su Composition-1K. Se stai scegliendo un modello, cerca quelle metriche (definizioni delle metriche; sezione metriche di Background Matting). Per ritratti/video, MODNet e Background Matting V2 sono molto efficaci; per immagini generiche di “oggetti salienti”, U2-Net è una solida base; per trasparenze difficili, FBA può dare risultati migliori.
Il formato immagine PAM (Portable Arbitrary Map) è un membro relativamente meno noto della famiglia di formati di file immagine progettati sotto l'ombrello del progetto Netpbm. È un formato altamente flessibile che può rappresentare un'ampia gamma di tipi di immagine con diverse profondità e tipi di dati pixel. PAM è essenzialmente un'estensione dei precedenti formati PBM (Portable Bitmap), PGM (Portable Graymap) e PPM (Portable Pixmap), collettivamente noti come formati PNM (Portable Any Map), che sono stati progettati per semplicità e facilità d'uso a scapito di funzionalità e compressione. PAM è stato introdotto per superare le limitazioni di questi formati mantenendo la loro semplicità e facilità d'uso.
Il formato PAM è progettato per essere indipendente dal dispositivo e dalla piattaforma, il che significa che le immagini salvate in questo formato possono essere aperte e manipolate su qualsiasi sistema senza preoccuparsi di problemi di compatibilità. Ciò viene ottenuto memorizzando i dati dell'immagine in un formato di testo normale o binario che può essere facilmente letto e scritto da un'ampia varietà di software. Il formato è anche estendibile, consentendo l'inclusione di nuove funzionalità e capacità senza compromettere la compatibilità con le versioni precedenti.
Un file PAM è costituito da un'intestazione seguita dai dati dell'immagine. L'intestazione è un testo ASCII che specifica la larghezza, l'altezza, la profondità e il valore massimo dell'immagine, nonché il tipo di tupla che definisce lo spazio colore. L'intestazione inizia con il numero magico "P7", seguito da una serie di tag separati da nuove righe che forniscono i metadati necessari. I dati dell'immagine seguono immediatamente l'intestazione e possono essere memorizzati in formato binario o ASCII, con il binario che è la scelta più comune a causa delle sue dimensioni di file più piccole e del tempo di elaborazione più rapido.
La profondità specificata nell'intestazione PAM indica il numero di canali o componenti per pixel. Ad esempio, una profondità di 3 in genere rappresenta i canali rosso, verde e blu di un'immagine a colori, mentre una profondità di 4 potrebbe includere un canale alfa aggiuntivo per la trasparenza. Il valore massimo, anch'esso specificato nell'intestazione, indica il valore massimo per qualsiasi canale, che a sua volta determina la profondità di bit dell'immagine. Ad esempio, un valore massimo di 255 corrisponde a 8 bit per canale.
Il tipo di tupla è una caratteristica chiave del formato PAM, poiché definisce l'interpretazione dei dati pixel. I tipi di tupla comuni includono "BLACKANDWHITE", "GRAYSCALE", "RGB" e "RGB_ALPHA", tra gli altri. Questa flessibilità consente ai file PAM di rappresentare un'ampia varietà di tipi di immagine, da semplici immagini in bianco e nero a immagini a colori con trasparenza. Inoltre, è possibile definire tipi di tupla personalizzati, rendendo il formato estensibile e adattabile a requisiti di imaging specializzati.
I file PAM possono anche includere righe di commento facoltative nell'intestazione, che iniziano con un carattere "#". Questi commenti vengono ignorati dai lettori di immagini e sono destinati ai lettori umani. Possono essere utilizzati per memorizzare metadati come la data di creazione dell'immagine, il software utilizzato per generare l'immagine o qualsiasi altra informazione rilevante che non rientra nei campi dell'intestazione standard.
I dati dell'immagine in un file PAM sono memorizzati in una sequenza di tuple, con ciascuna tupla che rappresenta un pixel. Le tuple sono ordinate da sinistra a destra e dall'alto verso il basso, iniziando dal pixel in alto a sinistra dell'immagine. Nel formato binario, i dati per ciascun canale di una tupla vengono memorizzati come un numero intero binario, con il numero di byte per canale determinato dal valore massimo specificato nell'intestazione. Nel formato ASCII, i valori del canale sono rappresentati come numeri decimali ASCII separati da spazi bianchi.
Uno dei vantaggi del formato PAM è la sua semplicità, che lo rende facile da analizzare e generare. Questa semplicità ha un costo in termini di dimensioni del file, poiché PAM non include alcun meccanismo di compressione integrato. Tuttavia, i file PAM possono essere compressi esternamente utilizzando algoritmi di compressione generici come gzip o bzip2, che possono ridurre significativamente le dimensioni del file per l'archiviazione o la trasmissione.
Nonostante i suoi vantaggi, il formato PAM non è ampiamente utilizzato nel mainstream a causa del predominio di altri formati di immagine come JPEG, PNG e GIF, che offrono compressione integrata e sono supportati da una gamma più ampia di software e hardware. Tuttavia, PAM rimane un formato prezioso per alcune applicazioni, in particolare quelle che richiedono un alto grado di flessibilità o che coinvolgono attività di elaborazione o analisi delle immagini in cui la semplicità e la precisione del formato sono vantaggiose.
Nel contesto dello sviluppo software, il formato PAM viene spesso utilizzato come formato intermedio nelle pipeline di elaborazione delle immagini. La sua struttura semplice lo rende facile da manipolare con script o programmi personalizzati e la sua flessibilità gli consente di adattarsi all'output di vari passaggi di elaborazione senza perdita di informazioni. Ad esempio, un'immagine potrebbe essere convertita in formato PAM, elaborata per applicare filtri o trasformazioni, quindi convertita in un formato più comune per la visualizzazione o la distribuzione.
La libreria Netpbm è il pacchetto software principale per lavorare con PAM e altri formati Netpbm. Fornisce una raccolta di strumenti da riga di comando per la conversione tra formati, nonché per eseguire manipolazioni di immagini di base come ridimensionamento, ritaglio e regolazioni del colore. La libreria include anche interfacce di programmazione per C e altri linguaggi, consentendo agli sviluppatori di leggere e scrivere file PAM direttamente all'interno delle loro applicazioni.
Per gli utenti e gli sviluppatori interessati a lavorare con il formato PAM, ci sono diverse considerazioni da tenere a mente. Innanzitutto, poiché il formato è meno comune, non tutti i software di visualizzazione e modifica delle immagini lo supporteranno in modo nativo. Potrebbe essere necessario utilizzare strumenti specializzati o convertire in un formato diverso per alcune attività. In secondo luogo, la mancanza di compressione significa che i file PAM possono essere piuttosto grandi, soprattutto per le immagini ad alta risoluzione, quindi l'archiviazione e la larghezza di banda dovrebbero essere prese in considerazione quando si lavora con questo formato.
Nonostante queste considerazioni, i punti di forza del formato PAM lo rendono uno strumento prezioso in alcuni contesti. La sua semplicità e flessibilità facilitano lo sviluppo e la sperimentazione rapidi e la sua estensibilità garantisce che possa adattarsi alle esigenze future. Per la ricerca, l'imaging scientifico o qualsiasi applicazione in cui l'integrità e la precisione dei dati dell'immagine sono fondamentali, PAM offre una soluzione robusta.
In conclusione, il formato immagine PAM è un formato file versatile e semplice che fa parte della famiglia di formati immagine Netpbm. È progettato per essere semplice, flessibile e indipendente dalla piattaforma, rendendolo adatto a un'ampia gamma di tipi di immagine e applicazioni. Sebbene possa non essere la scelta migliore per ogni situazione, in particolare quando le dimensioni del file o la compatibilità diffusa sono preoccupazioni, i suoi punti di forza lo rendono una scelta eccellente per applicazioni specializzate che richiedono la rappresentazione e la manipolazione precise dei dati dell'immagine. Pertanto, rimane un formato rilevante e utile nei campi dell'elaborazione e dell'analisi delle immagini.
Questo convertitore funziona interamente nel tuo browser. Quando selezioni un file, viene letto in memoria e convertito nel formato selezionato. Puoi quindi scaricare il file convertito.
Le conversioni iniziano istantaneamente e la maggior parte dei file viene convertita in meno di un secondo. I file più grandi potrebbero richiedere più tempo.
I tuoi file non vengono mai caricati sui nostri server. Vengono convertiti nel tuo browser e il file convertito viene quindi scaricato. Non vediamo mai i tuoi file.
Supportiamo la conversione tra tutti i formati di immagine, inclusi JPEG, PNG, GIF, WebP, SVG, BMP, TIFF e altro ancora.
Questo convertitore è completamente gratuito e lo sarà sempre. Poiché funziona nel tuo browser, non dobbiamo pagare per i server, quindi non dobbiamo addebitarti alcun costo.
Sì! Puoi convertire tutti i file che vuoi in una volta. Basta selezionare più file quando li aggiungi.