बैकग्राउंड हटाना किसी विषय को उसके परिवेश से अलग करता है ताकि आप उसे पारदर्शिता पर रख सकें, दृश्य को बदल सकें, या उसे एक नए डिज़ाइन में संयोजित कर सकें। हुड के तहत आप एक अल्फा मैट का अनुमान लगा रहे हैं - 0 से 1 तक प्रति-पिक्सेल अपारदर्शिता - और फिर अग्रभूमि को किसी और चीज़ पर अल्फा-कंपोज़िटिंग कर रहे हैं। यह पोर्टर-डफ का गणित है और "फ्रिंज" और स्ट्रेट बनाम प्रीमल्टीप्लाइड अल्फा जैसी परिचित कमियों का कारण है। प्रीमल्टीप्लिकेशन और रैखिक रंग पर व्यावहारिक मार्गदर्शन के लिए, माइक्रोसॉफ्ट के विन2डी नोट्स, सोरेन सैंडमैन, और लोमोंट का रैखिक सम्मिश्रण पर लेख देखें।
यदि आप कैप्चर को नियंत्रित कर सकते हैं, तो पृष्ठभूमि को एक ठोस रंग (अक्सर हरा) से पेंट करें और उस रंग को हटा दें। यह तेज़ है, फिल्म और प्रसारण में परीक्षण किया हुआ है, और वीडियो के लिए आदर्श है। ट्रेड-ऑफ प्रकाश और अलमारी हैं: रंगीन प्रकाश किनारों (विशेषकर बालों) पर फैलता है, इसलिए आप संदूषण को बेअसर करने के लिए डीस्पिल टूल का उपयोग करेंगे। अच्छे प्राइमरों में न्यूक के दस्तावेज़, मिक्सिंग लाइट, और एक व्यावहारिक फ्यूजन डेमो शामिल हैं।
गंदी पृष्ठभूमि वाली एकल छवियों के लिए, इंटरैक्टिव एल्गोरिदम को कुछ उपयोगकर्ता संकेतों की आवश्यकता होती है - जैसे, एक ढीला आयत या स्क्रिबल्स - और एक स्पष्ट मास्क बनाते हैं। कैनोनिकल विधि ग्रैबकट (पुस्तक अध्याय) है, जो अग्रभूमि/पृष्ठभूमि के लिए रंग मॉडल सीखता है और उन्हें अलग करने के लिए पुनरावृत्त रूप से ग्राफ कट का उपयोग करता है। आप GIMP के फोरग्राउंड सेलेक्ट में SIOX (ImageJ प्लगइन) पर आधारित समान विचार देखेंगे।
मैटिंग wispy सीमाओं (बाल, फर, धुआं, कांच) पर भिन्नात्मक पारद र्शिता को हल करता है। क्लासिक क्लोज्ड-फॉर्म मैटिंग एक ट्राइमैप (निश्चित रूप से-अग्रभूमि/निश्चित रूप से-पृष्ठभूमि/अज्ञात) लेता है और मजबूत किनारे की सटीकता के साथ अल्फा के लिए एक रैखिक प्रणाली को हल करता है। आधुनिक डीप इमेज मैटिंग एडोब कंपोजिशन-1K डेटासेट (MMEditing डॉक्स) पर तंत्रिका नेटवर्क को प्रशिक्षित करता है, और SAD, MSE, ग्रेडिएंट और कनेक्टिविटी (बेंचमार्क एक्सप्लेनर) जैसे मेट्रिक्स के साथ मूल्यांकन किया जाता है।
संबंधित विभाजन कार्य भी उपयोगी है: DeepLabv3+ एक एन्कोडर-डिकोडर और एट्रस कनवल्शन के साथ सीमाओं को परिष्कृत करता है (PDF); मास्क R-CNN प्रति-उदाहरण मास्क देता है (PDF); और SAM (सेगमेंट एनीथिंग) एक प्रॉम्प्टेबल फाउंडेशन मॉडल है जो अपरिचित छवियों पर शून्य-शॉट मास्क उत्पन्न करता है।
अकादमिक कार्य कंपोजिशन-1K पर SAD, MSE, ग्रेडिएंट, और कनेक्टिविटी त्रुटियों की रिपोर्ट करते हैं। यदि आप एक मॉडल चुन रहे हैं, तो उन मेट्रिक्स को देखें (मेट्रिक परिभाषाएं; बैकग्राउंड मैटिंग मेट्रिक्स सेक्शन)। पोर्ट्रेट/वीडियो के लिए, MODNet और बैकग्राउंड मैटिंग V2 मजबूत हैं; सामान्य "मुख्य वस्तु" छवियों के लिए, U2-Net एक ठोस आधार रेखा है; कठिन पारदर्शिता के लिए, FBA क्लीनर हो सकता है।
PAM (पोर्टेबल आर्बिट्रेरी मैप) इमेज फॉर्मेट, नेटपीबीएम प्रोजेक्ट के अंतर्गत डिजाइन किए गए इमेज फाइल फॉर्मेट के परिवार का एक अपेक्षाकृत कम ज्ञात सदस्य है। यह एक अत्यधिक लचीला फॉर्मेट है जो विभिन्न गहराई और पिक्सेल डेटा के प्रकारों के साथ इमेज प्रकारों की एक विस्तृत श्रृंखला का प्रतिनिधित्व कर सकता है। PAM अनिवार्य रूप से पहले के PBM (पोर्टेबल बिटमैप), PGM (पोर्टेबल ग्रेमैप), और PPM (पोर्टेबल पिक्समैप) फॉर्मेट का एक विस्तार है, जिन्हें सामूहिक रूप से PNM (पोर्टेबल एनी मैप) फॉर्मेट के रूप में जाना जाता है, जिन्हें फीचर और कम्प्रेशन की कीमत पर सरलता और उपयोग में आसानी के लिए डिजाइन किया गया था। PAM को इन फॉर्मेट की सीमाओं को दूर करने के लिए पेश किया गया था, जबकि उनकी सरलता और उपयोग में आसानी को बनाए रखा गया था।
PAM फॉर्मेट को डिवाइस और प्लेटफॉर्म-स्वतंत्र होने के लिए डिज़ाइन किया गया है, जिसका अर्थ है कि इस फॉर्मेट में सेव की गई इमेज को किसी भी सिस्टम पर कम्पैटिबिलिटी समस्याओं की चिंता किए बिना खोला और हेरफेर किया जा सकता है। यह इमेज डेटा को एक प्लेन-टेक्स्ट या बाइनरी फॉर्मेट में स्टोर करके प्राप्त किया जाता है जिसे विभिन्न प्रकार के सॉफ़्टवेयर द्वारा आसानी से पढ़ा और लिखा जा सकता है। यह फॉर्मेट एक्सटेंडेबल भी है, जो पुराने वर्शन के साथ कम्पैटिबिलिटी को तोड़े बिना नए फीचर और क्षमताओं को शामिल करने की अनुमति देता है।
एक PAM फ़ाइल में इमेज डेटा के बाद एक हेडर होता है। हेडर ASCII टेक्स्ट है जो इमेज की चौड़ाई, ऊंचाई, गहराई और अधिकतम मान को निर्दिष्ट करता है, साथ ही ट्यूपल प्रकार जो कलर स्पेस को परिभाषित करता है। हेडर मैजिक नंबर 'P7' से शुरू होता है, उसके बाद न्यूलाइन-सेपरेटेड टैग की एक श्रृं खला होती है जो आवश्यक मेटाडेटा प्रदान करती है। इमेज डेटा तुरंत हेडर का अनुसरण करता है और इसे बाइनरी या ASCII फॉर्मेट में स्टोर किया जा सकता है, बाइनरी इसके छोटे फ़ाइल आकार और तेज़ प्रोसेसिंग समय के कारण अधिक सामान्य विकल्प है।
PAM हेडर में निर्दिष्ट गहराई पिक्सेल प्रति चैनल या घटकों की संख्या को इंगित करती है। उदाहरण के लिए, 3 की गहराई आमतौर पर एक कलर इमेज के लाल, हरे और नीले चैनल का प्रतिनिधित्व करती है, जबकि 4 की गहराई में पारदर्शिता के लिए एक अतिरिक्त अल्फा चैनल शामिल हो सकता है। अधिकतम मान, जिसे हेडर में भी निर्दिष्ट किया गया है, किसी भी चैनल के लिए अधिकतम मान को इंगित करता है, जो बदले में इमेज की बिट गहराई निर्धारित करता है। उदाहरण के लिए, 255 का अधिकतम मान प्रति चैनल 8 बिट से मेल खाता है।
ट्यूपल प्रकार PAM फॉर्मेट की एक प्रमुख विशेषता है, क्योंकि यह पिक्सेल डेटा की व्याख्या को परिभाषित करता है। सामान्य ट्यूपल प्रकारों में 'BLACKANDWHITE', 'GRAYSCALE', 'RGB', और 'RGB_ALPHA' शामिल हैं। यह लचीलापन PAM फ़ाइलों को विभिन्न प्रकार के इमेज प्रकारों का प्रतिनिधित्व करने की अनुमति देता है, साधारण ब्लैक एंड व्हाइट इमेज से लेकर पारदर्शिता के साथ पूर्ण-रंगीन इमेज तक। इसके अतिरिक्त, कस्टम ट्यूपल प्रकारों को परिभाषित किया जा सकता है, जिससे फॉर्मेट एक्सटेंसिबल और विशेष इमेजिंग आवश्यकताओं के अनुकूल हो जाता है।
PAM फ़ाइलों में हेडर में वैकल्पिक कमेंट लाइनें भी शामिल हो सकती हैं, जो '#' कैरेक्टर से शुरू होती हैं। ये कमेंट इमेज रीडर द्वारा अनदेखी की जाती हैं और मानव पाठकों के लिए अभिप्रेत हैं। उनका उपयोग मेटाडेटा को स्टोर करने के लिए किया जा सकता है जैसे कि इमेज की निर्माण तिथि, इमेज को उत्पन्न करने के लिए उपयोग किया जाने वाला सॉफ़्टवेयर, या कोई अन्य प्रासंगिक जानकारी जो मानक हेडर फ़ील्ड में फिट नहीं होती है।
PAM फ़ाइल में इमेज डेटा ट्यूपल के अनुक्रम में संग्रहीत किया जाता है, प्रत्येक ट्यूपल एक पिक्सेल का प्रतिनिधित्व करता है। ट्यूपल को बाएं से दाएं और ऊपर से नीचे की ओर व्यवस्थित किया जाता है, जो इमेज के टॉप-लेफ्ट पिक्सेल से शुरू होता है। बाइनरी फॉर्मेट में, ट्यूपल के प्रत्येक चैनल के लिए डेटा को बाइनरी पूर्णांक के रूप में संग्रहीत किया जाता है, प्रति चैनल बाइट की संख्या हेडर में निर्दिष्ट अधिकतम मान द्वारा निर्धारित की जाती है। ASCII फॉर्मेट में, चैनल मानों को ASCII दशमलव संख्याओं के रूप में दर्शाया जाता है जो व्हाइटस्पेस द्वारा अलग किए जाते हैं।
PAM फॉर्मेट के फायदों में से एक इसकी सरलता है, जो इसे पार्स और जेनरेट करना आसान बनाती है। यह सरलता फ़ाइल आकार की कीमत पर आती है, क्योंकि PAM में कोई अंतर्निहित कम्प्रेशन तंत्र शामिल नहीं है। हालाँकि, PAM फ़ाइलों को gzip या bzip2 जैसे सामान्य-उद्देश्य कम्प्रेशन एल्गोरिदम का उपयोग करके बाहरी रूप से संपीड़ित किया जा सकता है, जो स्टोरेज या ट्रांसमिशन के लिए फ़ाइल आकार को काफी कम कर सकता है।
अपने फायदों के बावजूद, PAM फॉर्मेट का मुख्यधारा में व्यापक रूप से उपयोग नहीं किया जाता है क्योंकि JPEG, PNG और GIF जैसे अन्य इमेज फॉर्मेट का प्रभुत्व है, जो अंतर्निहित कम्प्रेशन प्रदान करते हैं और सॉफ़्टवेयर और हार्डवेयर की एक विस्तृत श्रृंखला द्वारा समर्थित हैं। हालाँकि, PAM कुछ अनुप्रयोगों के लिए एक मूल्यवान फॉर्मेट बना हुआ है, विशेष रूप से वे जो उच्च स्तर के लचीलेपन की आवश्यकता होती है या जिनमें इमेज प्रोसेसिंग या विश्लेषण कार्य शामिल होते हैं जहाँ फॉर्मेट की सरलता और सटीकता फायदेमंद होती है।
सॉफ़्टवेयर विकास के संदर्भ में, PAM फॉर्मेट को अक्सर इमेज प्रोसेसिंग पाइपलाइन में एक मध्यवर्ती फॉर्मेट के रूप में उपयोग किया जाता है। इसकी सीधी संरचना इसे कस्टम स्क्रिप्ट या प्रोग्राम के साथ हेरफेर करना आसान बनाती है, और इसका लचीलापन इसे सूचना की हानि के बिना विभिन्न प्रोसेसिंग चरणों के आउटपुट को समायोजित करने की अनुमति देता है। उदाहरण के लिए, एक इमेज को PAM फॉर्मेट में परिवर्तित किया जा सकता है, फ़िल्टर या परिवर्तन लागू करने के लिए संसाधित किया जा सकता है, और फिर प्रदर्शन या वितरण के लिए अधिक सामान्य फॉर्मेट में परिवर्तित किया जा सकता है।
PAM और अन्य नेटपीबीएम फॉर्मेट के साथ काम करने के लिए नेटपीबीएम लाइब्रेरी प्राथमिक सॉफ़्टवेयर पैकेज है। यह फॉर्मेट के बीच कनवर्ट करने के लिए कमांड-लाइन टूल का एक संग्रह प्रदान करता है, साथ ही स्केलिंग, क्रॉपिंग और कलर एडजस्टमेंट जैसे बुनियादी इमेज हेरफेर करने के लिए भी। लाइब्रेरी में C और अन्य भाषाओं के लिए प्रोग्रामिंग इंटरफ़ेस भी शामिल हैं, जिससे डेवलपर्स अपने अनुप्रयोग ों के भीतर PAM फ़ाइलों को सीधे पढ़ और लिख सकते हैं।
PAM फॉर्मेट के साथ काम करने
यह कनवर्टर पूरी तरह से आपके ब्राउज़र में चलता है। जब आप किसी फ़ाइल का चयन करते हैं, तो उसे मेमोरी में पढ़ा जाता है और चयनित प्रारूप में परिवर्तित किया जाता है। फिर आप परिवर्तित फ़ाइल डाउनलोड कर सकते हैं।
रूपांतरण तुरंत शुरू हो जाते हैं, और अधिकांश फ़ाइलें एक सेकंड के भीतर परिवर्तित हो जाती हैं। बड़ी फ़ाइलों में अधिक समय लग सकता है।
आपकी फाइलें कभी भी हमारे सर्वर पर अपलोड नहीं की जाती हैं। वे आपके ब्राउज़र में परिवर्तित हो जाती हैं, और फिर परिवर्तित फ़ाइल डाउनलोड हो जाती है। हम आपकी फाइलें कभी नहीं देखते हैं।
हम जेपीईजी, पीएनजी, जीआईएफ, वेबपी, एसवीजी, बीएमपी, টিআইএফএফ, और अधिक सहित सभी छवि प्रारूपों के बीच रूपांतरण का समर्थन करते हैं।
यह कनवर्टर पूरी तरह से मुफ्त है, और हमेशा मुफ्त रहेगा। क्योंकि यह आपके ब्राउज़र में चलता है, हमें सर्वर के लिए भुगतान करने की आवश्यकता नहीं है, इसलिए हमें आपसे शुल्क लेने की आवश्यकता नहीं है।
हाँ! आप एक साथ जितनी चाहें उतनी फाइलें परिवर्तित कर सकते हैं। बस उन्हें जोड़ते समय कई फाइलों का चयन करें।