बैकग्राउंड हटाना किसी विषय को उसके परिवेश से अलग करता है ताकि आप उसे पारदर्शिता पर रख सकें, दृश्य को बदल सकें, या उसे एक नए डिज़ाइन में संयोजित कर सकें। हुड के तहत आप एक अल्फा मैट का अनुमान लगा रहे हैं - 0 से 1 तक प्रति-पिक्सेल अपारदर्शिता - और फिर अग्रभूमि को किसी और चीज़ पर अल्फा-कंपोज़िटिंग कर रहे हैं। यह पोर्टर-डफ का गणित है और "फ्रिंज" और स्ट्रेट बनाम प्रीमल्टीप्लाइड अल्फा जैसी परिचित कमियों का कारण है। प्रीमल्टीप्लिकेशन और रैखिक रंग पर व्यावहारिक मार्गदर्शन के लिए, माइक्रोसॉफ्ट के विन2डी नोट्स, सोरेन सैंडमैन, और लोमोंट का रैखिक सम्मिश्रण पर लेख देखें।
यदि आप कैप्चर को नियंत्रित कर सकते हैं, तो पृष्ठभूमि को एक ठोस रंग (अक्सर हरा) से पेंट करें और उस रंग को हटा दें। यह तेज़ है, फिल्म और प्रसारण में परीक्षण किया हुआ है, और वीडियो के लिए आदर्श है। ट्रेड-ऑफ प्रकाश और अलमारी हैं: रंगीन प्रकाश किनारों (विशेषकर बालों) पर फैलता है, इसलिए आप संदूषण को बेअसर करने के लिए डीस्पिल टूल का उपयोग करेंगे। अच्छे प्राइमरों में न्यूक के दस्तावेज़, मिक्सिंग लाइट, और एक व्यावहारिक फ्यूजन डेमो शामिल हैं।
गंदी पृष्ठभूमि वाली एकल छवियों के लिए, इंटरैक्टिव एल्गोरिदम को कुछ उपयोगकर्ता संकेतों की आवश्यकता होती है - जैसे, एक ढीला आयत या स्क्रिबल्स - और एक स्पष्ट मास्क बनाते हैं। कैनोनिकल विधि ग्रैबकट (पुस्तक अध्याय) है, जो अग्रभूमि/पृष्ठभूमि के लिए रंग मॉडल सीखता है और उन्हें अलग करने के लिए पुनरावृत्त रूप से ग्राफ कट का उपयोग करता है। आप GIMP के फोरग्राउंड सेलेक्ट में SIOX (ImageJ प्लगइन) पर आधारित समान विचार देखेंगे।
मैटिंग wispy सीमाओं (बाल, फर, धुआं, कांच) पर भिन्नात्मक पारद र्शिता को हल करता है। क्लासिक क्लोज्ड-फॉर्म मैटिंग एक ट्राइमैप (निश्चित रूप से-अग्रभूमि/निश्चित रूप से-पृष्ठभूमि/अज्ञात) लेता है और मजबूत किनारे की सटीकता के साथ अल्फा के लिए एक रैखिक प्रणाली को हल करता है। आधुनिक डीप इमेज मैटिंग एडोब कंपोजिशन-1K डेटासेट (MMEditing डॉक्स) पर तंत्रिका नेटवर्क को प्रशिक्षित करता है, और SAD, MSE, ग्रेडिएंट और कनेक्टिविटी (बेंचमार्क एक्सप्लेनर) जैसे मेट्रिक्स के साथ मूल्यांकन किया जाता है।
संबंधित विभाजन कार्य भी उपयोगी है: DeepLabv3+ एक एन्कोडर-डिकोडर और एट्रस कनवल्शन के साथ सीमाओं को परिष्कृत करता है (PDF); मास्क R-CNN प्रति-उदाहरण मास्क देता है (PDF); और SAM (सेगमेंट एनीथिंग) एक प्रॉम्प्टेबल फाउंडेशन मॉडल है जो अपरिचित छवियों पर शून्य-शॉट मास्क उत्पन्न करता है।
अकादमिक कार्य कंपोजिशन-1K पर SAD, MSE, ग्रेडिएंट, और कनेक्टिविटी त्रुटियों की रिपोर्ट करते हैं। यदि आप एक मॉडल चुन रहे हैं, तो उन मेट्रिक्स को देखें (मेट्रिक परिभाषाएं; बैकग्राउंड मैटिंग मेट्रिक्स सेक्शन)। पोर्ट्रेट/वीडियो के लिए, MODNet और बैकग्राउंड मैटिंग V2 मजबूत हैं; सामान्य "मुख्य वस्तु" छवियों के लिए, U2-Net एक ठोस आधार रेखा है; कठिन पारदर्शिता के लिए, FBA क्लीनर हो सकता है।
BGRA एक डिजिटल इमेज फ़ाइल फ़ॉर्मेट है जो इमेज डेटा को बिटमैप के रूप में स्टोर करता है। यह स्टैंडर्ड RGBA फ़ॉर्मेट का एक वेरिएशन है जो प्रत्येक पिक्सेल के लिए रेड (R), ग्रीन (G), ब्लू (B) और अल्फा (A) चैनल के रूप में कलर वैल्यू स्टोर करता है। मुख्य अंतर यह है कि BGRA, RGBA की तुलना में रेड और ब्लू चैनल के ऑर्डर को रिवर्स करता है।
BGRA बिटमैप में, प्रत्येक पिक्सेल को डेटा के 4 बाइट्स (32 बिट्स) द्वारा दर्शाया जाता है। पहला बाइट ब्लू (B) वैल्यू स्टोर करता है, दूसरा बाइट ग्रीन (G) वैल्यू स्टोर करता है, तीसरा बाइट रेड (R) वैल्यू स्टोर करता है और चौथा बाइट अल्फा (A) या ट्रांसपेरेंसी वैल्यू स्टोर करता है। यह अधिक सामान्य RGBA ऑर्डर के विपरीत है।
प्रत्येक पिक्सेल का रंग रेड, ग्रीन और ब्लू की अलग-अलग तीव्रता को मिलाकर निर्धारित किया जाता है। प्रत्येक कलर चैनल को 8-बिट अनसाइंड इंटीजर द्वारा दर्शाया जाता है, जिससे 0 से 255 तक के वैल्यू की अनुमति मिलती है। 0 का वैल्यू उस कलर के लिए कोई तीव्रता नहीं दर्शाता है, जबकि 255 पूर्ण तीव्रता दर्शाता है। उदाहरण के लिए, BGRA ऑर्डर में (0, 0, 255, 255) वैल्यू वाला एक पिक्सेल पूरी तरह से अपारदर्शी नीला होगा।
अल्फा चैनल प्रत्येक पिक्सेल की अपारदर्शिता को निर्दिष्ट करता है और ट्रांसपेरेंसी इफ़ेक्ट की अनुमति देता है। यह भी 0 (पूरी तरह से पारदर्शी) से 255 (पूरी तरह से अपारदर्शी) तक की रेंज वाला 8-बिट वैल्यू है। 128 का अल्फा वैल्यू पिक्सेल को 50% पारदर्शी बना देगा।
RGBA पर BGRA फ़ॉर्मेट का एक लाभ बेहतर मेमोरी अलाइनमेंट और परफॉर्मेंस है। कई CPU को लिटिल-एंडियन बाइट ऑर्डर में डेटा को पढ़ने और लिखने के लिए ऑप्टिमाइज़ किया जाता है। लिटिल-एंडियन में, सबसे कम महत्वपूर्ण बाइट को पहले स्टोर किया जाता है। चूंकि BGRA ब्लू चैनल (जो अक्सर सबसे कम महत्वपूर्ण होता है) को पहले रखता है, यह CPU को लिटिल-एंडियन सिस्टम पर RGBA की तुलना में BGRA डेटा को अधिक कुशलता से पढ़ने और लिखने की अनुमति देता है।
BGRA का उपयोग कुछ ग्राफ़िक्स लाइब्रेरी और फ़्रेमवर्क द्वारा आंतरिक रूप से इमेज बफ़र और टेक्सचर के लिए पसंदीदा पिक्सेल फ़ॉर्मेट के रूप में किया जाता है। हालाँकि, PNG या JPEG जैसे अधिकांश इमेज फ़ाइल फ़ॉर्मेट BGR के बजाय RGB चैनल ऑर्डर के साथ सेव किए जाते हैं। जब किसी इमेज को RGB सोर्स से BGRA बफ़र में लोड किया जाता है, तो रेड और ब्लू चैनल को स्वैप किया जाना चाहिए।
एल्गोरिदमिक रूप से, BGRA और RGBA के बीच कन्वर्ट करना सीधा है। BGRA से RGBA में कन्वर्ट करने के लिए, प्रत्येक पिक्सेल के लिए रेड और ब्लू बाइट्स को स्वैप किया जाता है जबकि ग्रीन और अल्फा उसी पोजीशन पर रहते हैं। RGBA स े BGRA में कन्वर्ट करना रिवर्स में यही प्रक्रिया है।
यहाँ RGBA और BGRA दोनों फ़ॉर्मेट में एक पिक्सेल का उदाहरण दिया गया है: RGBA: (रेड: 128, ग्रीन: 64, ब्लू: 192, अल्फा: 255) BGRA: (ब्लू: 192, ग्रीन: 64, रेड: 128, अल्फा: 255)
BGRA एक लीनियर कलर स्पेस है, जिसका अर्थ है कि तीव्रता मान सीधे प्रकाश की मात्रा के समानुपाती होते हैं। यह sRGB जैसे नॉन-लीनियर कलर स्पेस के विपरीत है जो तीव्रता मानों पर गामा कर्व लागू करते हैं। BGRA डेटा से निपटने के दौरान यह जानना महत्वपूर्ण है कि रंग लीनियर स्पेस में हैं या गामा-करेक्टेड हैं।
BGRA के लिए मुख्य उपयोग का मामला ग्राफ़िक्स प्रोग्रामिंग में है जब GPU API और हार्डवेयर के साथ सीधे इंटरफ़ेस किया जाता है जो BGRA को अपने मूल कलर फ़ॉर्मेट के रूप में उपयोग करते हैं। DirectX, OpenGL और Vulkan जैसी लाइब्रेरी अक्सर PC हार्डवेयर पर बेहतर परफॉर्मेंस के लिए मेमोरी बफ़र और टेक्सचर में BGRA डेटा के साथ काम करती हैं।
संक्षेप में, BGRA मे मोरी में प्रति पिक्सेल 32-बिट इमेज डेटा स्टोर करने के लिए RGBA का एक विकल्प है। मुख्य अंतर यह है कि रेड और ब्लू चैनल रिवर्स होते हैं। RGBA की तुलना में BGRA लिटिल-एंडियन CPU आर्किटेक्चर पर बेहतर मेमोरी एक्सेस पैटर्न और परफॉर्मेंस प्रदान कर सकता है। अधिकांश सामान्य इमेज फ़ाइल फ़ॉर्मेट RGB ऑर्डर का उपयोग करते हैं, इसलिए BGRA डेटा को लोड और सेव करते समय कन्वर्ज़न आवश्यक है।
यह कनवर्टर पूरी तरह से आपके ब्राउज़र में चलता है। जब आप किसी फ़ाइल का चयन करते हैं, तो उसे मेमोरी में पढ़ा जाता है और चयनित प्रारूप में परिवर्तित किया जाता है। फिर आप परिवर्तित फ़ाइल डाउनलोड कर सकते हैं।
रूपांतरण तुरंत शुरू हो जाते हैं, और अधिकांश फ़ाइलें एक सेकंड के भीतर परिवर्तित हो जाती हैं। बड़ी फ़ाइलों में अधिक समय लग सकता है।
आपकी फाइलें कभी भी हमारे सर्वर पर अपलोड नहीं की जाती हैं। वे आपके ब्राउज़र में परिवर्तित हो जाती हैं, और फिर परिवर्तित फ़ाइल डाउनलोड हो जाती है। हम आपकी फाइलें कभी नहीं देखते हैं।
हम जेपीईजी, पीएनजी, जीआईएफ, वेबपी, एसवीजी, बीएमपी, টিআইএফএফ, और अधिक सहित सभी छवि प्रारूपों के बीच रूपांतरण का समर्थन करते हैं।
यह कनवर्टर पूरी तरह से मुफ्त है, और हमेशा मुफ्त रहेगा। क्योंकि यह आपके ब्राउज़र में चलता है, हमें सर्वर के लिए भुगतान करने की आ वश्यकता नहीं है, इसलिए हमें आपसे शुल्क लेने की आवश्यकता नहीं है।
हाँ! आप एक साथ जितनी चाहें उतनी फाइलें परिवर्तित कर सकते हैं। बस उन्हें जोड़ते समय कई फाइलों का चयन करें।