बैकग्राउंड हटाना किसी विषय को उसके परिवेश से अलग करता है ताकि आप उसे पारदर्शिता पर रख सकें, दृश्य को बदल सकें, या उसे एक नए डिज़ाइन में संयोजित कर सकें। हुड के तहत आप एक अल्फा मैट का अनुमान लगा रहे हैं - 0 से 1 तक प्रति-पिक्सेल अपारदर्शिता - और फिर अग्रभूमि को किसी और चीज़ पर अल्फा-कंपोज़िटिंग कर रहे हैं। यह पोर्टर-डफ का गणित है और "फ्रिंज" और स्ट्रेट बनाम प्रीमल्टीप्लाइड अल्फा जैसी परिचित कमियों का कारण है। प्रीमल्टीप्लिकेशन और रैखिक रंग पर व्यावहारिक मार्गदर्शन के लिए, माइक्रोसॉफ्ट के विन2डी नोट्स, सोरेन सैंडमैन, और लोमोंट का रैखिक सम्मिश्रण पर लेख देखें।
यदि आप कैप्चर को नियंत्रित कर सकते हैं, तो पृष्ठभूमि को एक ठोस रंग (अक्सर हरा) से पेंट करें और उस रंग को हटा दें। यह तेज़ है, फिल्म और प्रसारण में परीक्षण किया हुआ है, और वीडियो के लिए आदर्श है। ट्रेड-ऑफ प्रकाश और अलमारी हैं: रंगीन प्रकाश किनारों (विशेषकर बालों) पर फैलता है, इसलिए आप संदूषण को बेअसर करने के लिए डीस्पिल टूल का उपयोग करेंगे। अच्छे प्राइमरों में न्यूक के दस्तावेज़, मिक्सिंग लाइट, और एक व्यावहारिक फ्यूजन डेमो शामिल हैं।
गंदी पृष्ठभूमि वाली एकल छवियों के लिए, इंटरैक्टिव एल्गोरिदम को कुछ उपयोगकर्ता संकेतों की आवश्यकता होती है - जैसे, एक ढीला आयत या स्क्रिबल्स - और एक स्पष्ट मास्क बनाते हैं। कैनोनिकल विधि ग्रैबकट (पुस्तक अध्याय) है, जो अग्रभूमि/पृष्ठभूमि के लिए रंग मॉडल सीखता है और उन्हें अलग करने के लिए पुनरावृत्त रूप से ग्राफ कट का उपयोग करता है। आप GIMP के फोरग्राउंड सेलेक्ट में SIOX (ImageJ प्लगइन) पर आधारित समान विचार देखेंगे।
मैटिंग wispy सीमाओं (बाल, फर, धुआं, कांच) पर भिन्नात्मक पारद र्शिता को हल करता है। क्लासिक क्लोज्ड-फॉर्म मैटिंग एक ट्राइमैप (निश्चित रूप से-अग्रभूमि/निश्चित रूप से-पृष्ठभूमि/अज्ञात) लेता है और मजबूत किनारे की सटीकता के साथ अल्फा के लिए एक रैखिक प्रणाली को हल करता है। आधुनिक डीप इमेज मैटिंग एडोब कंपोजिशन-1K डेटासेट (MMEditing डॉक्स) पर तंत्रिका नेटवर्क को प्रशिक्षित करता है, और SAD, MSE, ग्रेडिएंट और कनेक्टिविटी (बेंचमार्क एक्सप्लेनर) जैसे मेट्रिक्स के साथ मूल्यांकन किया जाता है।
संबंधित विभाजन कार्य भी उपयोगी है: DeepLabv3+ एक एन्कोडर-डिकोडर और एट्रस कनवल्शन के साथ सीमाओं को परिष्कृत करता है (PDF); मास्क R-CNN प्रति-उदाहरण मास्क देता है (PDF); और SAM (सेगमेंट एनीथिंग) एक प्रॉम्प्टेबल फाउंडेशन मॉडल है जो अपरिचित छवियों पर शून्य-शॉट मास्क उत्पन्न करता है।
अकादमिक कार्य कंपोजिशन-1K पर SAD, MSE, ग्रेडिएंट, और कनेक्टिविटी त्रुटियों की रिपोर्ट करते हैं। यदि आप एक मॉडल चुन रहे हैं, तो उन मेट्रिक्स को देखें (मेट्रिक परिभाषाएं; बैकग्राउंड मैटिंग मेट्रिक्स सेक्शन)। पोर्ट्रेट/वीडियो के लिए, MODNet और बैकग्राउंड मैटिंग V2 मजबूत हैं; सामान्य "मुख्य वस्तु" छवियों के लिए, U2-Net एक ठोस आधार रेखा है; कठिन पारदर्शिता के लिए, FBA क्लीनर हो सकता है।
IIQ इमेज फॉर्मेट इंटेलिजेंट इमेज क्वालिटी के लिए जाना जाता है और यह फेज वन द्वारा विकसित एक मालिकाना रॉ इमेज फाइल फॉर्मेट है। एक रॉ फाइल फॉर्मेट के रूप में, IIQ को कैमरे के सेंसर द्वारा रिकॉर्ड किए गए सभी इमेज डेटा को कैप्चर करने के लिए डिज़ाइन किया गया है, साथ ही कैप्चर की गई स्थितियों, जैसे कैमरा सेटिंग्स और सीन की लाइटिंग के साथ। इस फॉर्मेट का उपयोग मुख्य रूप से मीडियम फॉर्मेट कैमरों और फेज वन द्वारा निर्मित डिजिटल बैक में किया जाता है, जिन्हें अक्सर हाई-एंड फोटोग्राफी में नियोजित किया जाता है जहां इमेज क्वालिटी और पोस्ट-प्रोसेसिंग लचीलापन सर्वोपरि होते हैं।
IIQ जैसे रॉ इमेज फॉर्मेट मूल रूप से JPEG या PNG जैसे मानक इमेज फॉर्मेट से अलग होते हैं। जबकि JPEG इमेज को कैमरे के भीतर प्रोसेस और कंप्रेस किया जाता है, जिसके परिणामस्वरूप छोटे फाइल साइज और पोस्ट-प्रोसेसिंग में कम लचीलापन होता है, IIQ जैसी रॉ फाइलों को न्यूनतम रूप से प्रोसेस किया जाता है। इसका मतलब है कि वे बहुत अधिक जानकारी रखते हैं, जो फोटोग्राफरों को इमेज क्वालिटी को खराब किए बिना एक्सपोज़र, व्हाइट बैलेंस और अन्य सेटिंग्स में अधिक महत्वपूर्ण समायोजन करने की अनुमति देता है।
IIQ फॉर्मेट दो वेरिएंट में आता है: IIQ L और IIQ S। 'L' वेरिएंट लॉसलेस है, जिसका अर्थ है कि यह बिना किसी विवरण या गुणवत्ता की हानि के इमेज डेटा को कंप्रेस करता है। यह उन स्थितियों के लिए आदर्श है जहां अत्यधिक इमेज निष्ठा की आवश्यकता होती है। दूसरी ओर, 'S' वेरिएंट फाइल साइज को कम करने के लिए थोड़ा लॉसी कंप्रेसन लागू करता है, जो तब फायदेमंद हो सकता है जब स्टो रेज स्पेस या ट्रांसफर स्पीड सीमित हो। कंप्रेसन के बावजूद, IIQ S फाइलें अभी भी विशिष्ट JPEG फाइलों की तुलना में उच्च गुणवत्ता स्तर बनाए रखती हैं।
IIQ फॉर्मेट की प्रमुख विशेषताओं में से एक 16-बिट कलर डेप्थ का उपयोग है, जो रंगों और टोनल ग्रेडेशन की एक विशाल श्रृंखला की अनुमति देता है। यह मानक JPEG इमेज में पाई जाने वाली 8-बिट कलर डेप्थ से काफी अधिक है, जो प्रति कलर चैनल केवल 256 स्तरों के ग्रे को प्रदर्शित कर सकती है। 16-बिट डेप्थ के साथ, IIQ फाइलें प्रति चैनल 65,536 स्तरों के ग्रे का प्रतिनिधित्व कर सकती हैं, जो रंगों के बीच चिकनी संक्रमण और छाया और हाइलाइट में अधिक विवरण प्रदान करती हैं।
IIQ फॉर्मेट उन्नत कलर प्रोफाइल को भी शामिल करता है जो विशिष्ट सेंसर और उपयोग किए गए कैमरा सिस्टम के अनुरूप होते हैं। ये प्रोफाइल विभिन्न उपकरणों और प्रकाश स्थितियों में कलर सटीकता और स्थिरता बनाए रखने में मदद करते हैं । फेज वन कलर विशेषज्ञों के साथ मिलकर काम करता है ताकि यह सुनिश्चित किया जा सके कि IIQ फाइलों में कलर प्रतिपादन यथासंभव वास्तविक जीवन के समान हो, जो पेशेवर फोटोग्राफरों के लिए विशेष रूप से महत्वपूर्ण है जो सटीक कलर प्रबंधन की मांग करते हैं।
IIQ फॉर्मेट का एक और लाभ मेटाडेटा के संदर्भ में इसका लचीलापन है। IIQ फाइलें कैमरा सेटिंग्स, GPS डेटा और उपयोग किए गए कैमरा और लेंस के लिए विशिष्ट पहचानकर्ताओं सहित मेटाडेटा की एक विस्तृत श्रृंखला को स्टोर कर सकती हैं। यह मेटाडेटा बड़ी इमेज लाइब्रेरी को व्यवस्थित करने और प्रबंधित करने के साथ-साथ शूटिंग की स्थितियों को दोहराने या विशिष्ट उपकरणों के उपयोग को ट्रैक करने के लिए अमूल्य है।
एक IIQ फाइल की फाइल संरचना को मजबूत और लचीला दोनों तरह से डिज़ाइन किया गया है। फॉर्मेट एक TIFF-जैसी संरचना का उपयोग करता है, जो इमेजिंग उद्योग में एक अच्छी तरह से स्थाप ित मानक है। यह संरचना एक ही फाइल में विभिन्न प्रकार के डेटा को शामिल करने की अनुमति देती है, जैसे रॉ इमेज डेटा, एक प्रीव्यू इमेज और मेटाडेटा। एक मानक संरचना के उपयोग का यह भी अर्थ है कि IIQ फाइलों को कई सॉफ़्टवेयर अनुप्रयोगों द्वारा पढ़ा और प्रोसेस किया जा सकता है, हालांकि सबसे अच्छे परिणाम अक्सर फेज वन के अपने कैप्चर वन सॉफ़्टवेयर का उपयोग करके प्राप्त किए जाते हैं।
कैप्चर वन एक पेशेवर-ग्रेड इमेज एडिटिंग सॉफ़्टवेयर है जो विशेष रूप से IIQ फाइलों के साथ काम करने के लिए डिज़ाइन किए गए टूल का एक सूट प्रदान करता है। यह शोर में कमी, शार्पनिंग और लेंस सुधार सहित उन्नत रॉ प्रोसेसिंग क्षमताएं प्रदान करता है। कैप्चर वन टेथर्ड शूटिंग की भी अनुमति देता है, जहां इमेज को सीधे कंप्यूटर पर कैप्चर किया जाता है और वास्तविक समय में संपादित किया जा सकता है, जो स्टूडियो फोटोग्राफरों के लिए एक लोकप्रि य विशेषता है।
IIQ फॉर्मेट के कई लाभों के बावजूद, कुछ बातों को ध्यान में रखना है। फाइल साइज काफी बड़ा हो सकता है, खासकर लॉसलेस IIQ L वेरिएंट के लिए। इससे बढ़ी हुई स्टोरेज आवश्यकताओं और धीमी फाइल ट्रांसफर समय हो सकता है। इसके अतिरिक्त, क्योंकि IIQ एक मालिकाना फॉर्मेट है, यह DNG (डिजिटल नेगेटिव) जैसे अधिक सामान्य रॉ फॉर्मेट की तरह व्यापक रूप से समर्थित नहीं है, जो तृतीय-पक्ष सॉफ़्टवेयर और सेवाओं के साथ इसकी संगतता को सीमित कर सकता है।
फाइल साइज के मुद्दे को दूर करने के लिए, फेज वन ने IIQ फॉर्मेट के भीतर एक इंटेलिजेंट प्रीव्यू सिस्टम लागू किया है। इस सिस्टम में IIQ फाइल के भीतर एम्बेड की गई इमेज का एक छोटा, कम-रिज़ॉल्यूशन संस्करण शामिल है। इस प्रीव्यू का उपयोग पूर्ण रॉ फाइल को प्रोसेस करने की आवश्यकता के बिना त्वरित ब्राउज़िंग और चयन के लिए किया जा सकता है, जो समय लेने वाला हो सकता है। एक बार वांछित इमेज का चयन हो जाने के बाद, केवल उन्हें ही पूरी तरह से प्रोसेस करने की आवश्यकता होती है, जिससे समय और कंप्यूटिंग संसाधन दोनों की बचत होती है।
IIQ फाइलों का प्रोसेसिंग पेशेवर फोटोग्राफरों के वर्कफ़्लो में एक महत्वपूर्ण कदम है। कैमरे के सेंसर द्वारा कैप्चर किया गया रॉ डेटा सीधे एक इमेज के रूप में देखने योग्य नहीं होता है; इसे पहले JPEG या TIFF जैसे मानक इमेज फॉर्मेट में परिवर्तित किया जाना चाहिए। यह रूपांतरण प्रक्रिया वह जगह है जहां फोटोग्राफर वांछित परिणाम प्राप्त करने के लिए एक्सपोज़र, कंट्रास्ट और कलर बैलेंस जैसे मापदंडों को समायोजित करते हुए अंतिम इमेज पर रचनात्मक नियंत्रण का प्रयोग कर सकते हैं।
एक इमेज की डायनामिक रेंज, जो सबसे गहरी छाया से सबसे चमकीले हाइलाइट तक ल्यूमिनेंस मानों की सीमा है, एक और क्षेत्र है जहां IIQ फॉर्मेट उत्कृष्ट है। IIQ फाइलों में कैप्चर की गई उच्च डायनामिक रेंज फोटोग्राफरों को उन विवरणों को पुनर्प्राप्त करने