बैकग्राउंड हटाना किसी विषय को उसके परिवेश से अलग करता है ताकि आप उसे पारदर्शिता पर रख सकें, दृश्य को बदल सकें, या उसे एक नए डिज़ाइन में संयोजित कर सकें। हुड के तहत आप एक अल्फा मैट का अनुमान लगा रहे हैं - 0 से 1 तक प्रति-पिक्सेल अपारदर्शिता - और फिर अग्रभूमि को किसी और चीज़ पर अल्फा-कंपोज़िटिंग कर रहे हैं। यह पोर्टर-डफ का गणित है और "फ्रिंज" और स्ट्रेट बनाम प्रीमल्टीप्लाइड अल्फा जैसी परिचित कमियों का कारण है। प्रीमल्टीप्लिकेशन और रैखिक रंग पर व्यावहारिक मार्गदर्शन के लिए, माइक्रोसॉफ्ट के विन2डी नोट्स, सोरेन सैंडमैन, और लोमोंट का रैखिक सम्मिश्रण पर लेख देखें।
यदि आप कैप्चर को नियंत्रित कर सकते हैं, तो पृष्ठभूमि को एक ठोस रंग (अक्सर हरा) से पेंट करें और उस रंग को हटा दें। यह तेज़ है, फिल्म और प्रसारण में परीक्षण किया हुआ है, और वीडियो के लिए आदर्श है। ट्रेड-ऑफ प्रकाश और अलमारी हैं: रंगीन प्रकाश किनारों (विशेषकर बालों) पर फैलता है, इसलिए आप संदूषण को बेअसर करने के लिए डीस्पिल टूल का उपयोग करेंगे। अच्छे प्राइमरों में न्यूक के दस्तावेज़, मिक्सिंग लाइट, और एक व्यावहारिक फ्यूजन डेमो शामिल हैं।
गंदी पृष्ठभूमि वाली एकल छवियों के लिए, इंटरैक्टिव एल्गोरिदम को कुछ उपयोगकर्ता संकेतों की आवश्यकता होती है - जैसे, एक ढीला आयत या स्क्रिबल्स - और एक स्पष्ट मास्क बनाते हैं। कैनोनिकल विधि ग्रैबकट (पुस्तक अध्याय) है, जो अग्रभूमि/पृष्ठभूमि के लिए रंग मॉडल सीखता है और उन्हें अलग करने के लिए पुनरावृत्त रूप से ग्राफ कट का उपयोग करता है। आप GIMP के फोरग्राउंड सेलेक्ट में SIOX (ImageJ प्लगइन) पर आधारित समान विचार देखेंगे।
मैटिंग wispy सीमाओं (बाल, फर, धुआं, कांच) पर भिन्नात्मक पारद र्शिता को हल करता है। क्लासिक क्लोज्ड-फॉर्म मैटिंग एक ट्राइमैप (निश्चित रूप से-अग्रभूमि/निश्चित रूप से-पृष्ठभूमि/अज्ञात) लेता है और मजबूत किनारे की सटीकता के साथ अल्फा के लिए एक रैखिक प्रणाली को हल करता है। आधुनिक डीप इमेज मैटिंग एडोब कंपोजिशन-1K डेटासेट (MMEditing डॉक्स) पर तंत्रिका नेटवर्क को प्रशिक्षित करता है, और SAD, MSE, ग्रेडिएंट और कनेक्टिविटी (बेंचमार्क एक्सप्लेनर) जैसे मेट्रिक्स के साथ मूल्यांकन किया जाता है।
संबंधित विभाजन कार्य भी उपयोगी है: DeepLabv3+ एक एन्कोडर-डिकोडर और एट्रस कनवल्शन के साथ सीमाओं को परिष्कृत करता है (PDF); मास्क R-CNN प्रति-उदाहरण मास्क देता है (PDF); और SAM (सेगमेंट एनीथिंग) एक प्रॉम्प्टेबल फाउंडेशन मॉडल है जो अपरिचित छवियों पर शून्य-शॉट मास्क उत्पन्न करता है।
अकादमिक कार्य कंपोजिशन-1K पर SAD, MSE, ग्रेडिएंट, और कनेक्टिविटी त्रुटियों की रिपोर्ट करते हैं। यदि आप एक मॉडल चुन रहे हैं, तो उन मेट्रिक्स को देखें (मेट्रिक परिभाषाएं; बैकग्राउंड मैटिंग मेट्रिक्स सेक्शन)। पोर्ट्रेट/वीडियो के लिए, MODNet और बैकग्राउंड मैटिंग V2 मजबूत हैं; सामान्य "मुख्य वस्तु" छवियों के लिए, U2-Net एक ठोस आधार रेखा है; कठिन पारदर्शिता के लिए, FBA क्लीनर हो सकता है।
JPS इमेज फॉर्मेट, JPEG स्टीरियो के लिए संक्षिप्त, एक फाइल फॉर्मेट है जिसका उपयोग डिजिटल कैमरों द्वारा ली गई या 3D रेंडरिंग सॉफ़्टवेयर द्वारा बनाई गई स्टीरियोस्कोपिक तस्वीरों को स्टोर करने के लिए किया जाता है। यह अनिवार्य रूप से एक ही फाइल के भीतर दो JPEG इमेज की एक साइड-बाय-साइड व्यवस्था है, जो उपयुक्त सॉफ़्टवेयर या हार्डवेयर के माध्यम से देखे जाने पर, एक 3D प्रभाव प्रदान करती है। यह फॉर्मेट इमेज में गहराई का भ्रम पैदा करने के लिए विशेष रूप से उपयोगी है, जो संगत डिस्प्ले सिस्टम या 3D चश्मे वाले उपयोगकर्ताओं के लिए देखने के अनुभव को बढ़ाता है।
JPS फॉर्मेट दो इमेज को स्टोर करने के लिए अच्छी तरह से स्थापित JPEG (जॉइंट फोटो ग्राफिक एक्सपर्ट्स ग्रुप) कंप्रेशन तकनीक का लाभ उठाता है। JPEG एक लॉसी कंप्रेशन विधि है, जिसका अर्थ है कि यह कम महत्वपूर्ण जानकारी को चुनिंदा रूप से त्याग कर फ़ाइल आकार को कम करता है, अक्सर मानवीय आँख के लिए छवि गुणवत्ता में ध्यान देने योग्य कमी के बिना। यह JPS फ़ाइलों को एक के बजाय दो इमेज होने के बावजूद अपेक्षाकृत छोटा और प्रबंधनीय बनाता है।
एक JPS फ़ाइल अनिवार्य रूप से एक विशिष्ट संरचना वाली JPEG फ़ाइल है। इसमें एक ही फ्रेम के भीतर साइड-बाय-साइड दो JPEG-कंप्रेस्ड इमेज होती हैं। इन इमेज को लेफ्ट-आई और राइट-आई इमेज कहा जाता है, और वे एक ही दृश्य के थोड़े अलग दृष्टिकोण का प्रतिनिधित्व करते हैं, जो हमारी प्रत्येक आँख द्वारा देखी गई चीज़ों के बीच मामूली अंतर की नकल करते हैं। यह अंतर वह है जो इमेज को सही ढंग से देखे जाने पर गहराई की धारणा की अनुमति देता है।
एक JPS इमेज के लिए मानक रिज़ॉल्यूशन आमत ौर पर लेफ्ट और राइट दोनों इमेज को समायोजित करने के लिए एक मानक JPEG इमेज की चौड़ाई से दोगुना होता है। उदाहरण के लिए, यदि एक मानक JPEG इमेज का रिज़ॉल्यूशन 1920x1080 पिक्सेल है, तो एक JPS इमेज का रिज़ॉल्यूशन 3840x1080 पिक्सेल होगा, जिसमें प्रत्येक साइड-बाय-साइड इमेज कुल चौड़ाई का आधा हिस्सा घेरेगी। हालाँकि, रिज़ॉल्यूशन इमेज के स्रोत और इच्छित उपयोग के आधार पर भिन्न हो सकता है।
3D में JPS इमेज देखने के लिए, एक दर्शक को एक संगत डिस्प्ले डिवाइस या सॉफ़्टवेयर का उपयोग करना चाहिए जो साइड-बाय-साइड इमेज की व्याख्या कर सकता है और उन्हें प्रत्येक आँख को अलग से प्रस्तुत कर सकता है। यह विभिन्न तरीकों से प्राप्त किया जा सकता है, जैसे एनाग्लीफ 3D, जहाँ इमेज को रंग द्वारा फ़िल्टर किया जाता है और रंगीन चश्मे के साथ देखा जाता है; पोलराइज़्ड 3D, जहाँ इमेज को पोलराइज़्ड फ़िल्टर के माध्यम से प्रोजेक्ट किया जाता है और पोलराइज़्ड चश्मे के साथ देखा जाता है; या एक्टिव शटर 3D, जहाँ इमेज को वैकल्पिक रूप से प्रदर्शित किया जाता है और शटर चश्मे के साथ सिंक्रनाइज़ किया जाता है जो प्रत्येक आँख को सही इमेज दिखाने के लिए तेजी से खुलते और बंद होते हैं।
एक JPS इमेज की फ़ाइल संरचना एक मानक JPEG फ़ाइल के समान है। इसमें एक हेडर होता है, जिसमें SOI (स्टार्ट ऑफ़ इमेज) मार्कर शामिल होता है, इसके बाद कई सेगमेंट होते हैं जिनमें मेटाडेटा के विभिन्न भाग और स्वयं इमेज डेटा होता है। सेगमेंट में APP (एप्लीकेशन) मार्कर शामिल होते हैं, जिसमें Exif मेटाडेटा जैसी जानकारी हो सकती है, और DQT (डिफ़ाइन क्वांटिज़ेशन टेबल) सेगमेंट, जो इमेज डेटा को कंप्रेस करने के लिए उपयोग की जाने वाली क्वांटिज़ेशन टेबल को परिभाषित करता है।
JPS फ़ाइल में प्रमुख सेगमेंट में से एक JFIF (JPEG फ़ाइल इंटरचेंज फ़ॉर्मेट) सेगमेंट है, जो निर्दिष्ट करता है कि फ़ाइल JFIF मानक के अनुरूप है। यह सेगमेंट सॉफ़्टवेयर और हार्डवेयर की एक विस्तृत श्रृंखला के साथ संगतता सुनिश्चित करने के लिए महत्वपूर्ण है। इसमें थंबनेल इमेज का आस्पेक्ट रेशियो और रिज़ॉल्यूशन जैसी जानकारी भी शामिल है, जिसका उपयोग त्वरित पूर्वावलोकन के लिए किया जा सकता है।
JPS फ़ाइल में वास्तविक इमेज डेटा SOS (स्टार्ट ऑफ़ स्कैन) सेगमेंट में संग्रहीत किया जाता है, जो हेडर और मेटाडेटा सेगमेंट का अनुसरण करता है। इस सेगमेंट में लेफ्ट और राइट दोनों इमेज के लिए कंप्रेस्ड इमेज डेटा होता है। डेटा को JPEG कंप्रेशन एल्गोरिथम का उपयोग करके एन्कोड किया जाता है, जिसमें रंग स्थान रूपांतरण, सबसैंपलिंग, असतत कोसाइन ट्रांसफ़ॉर्म (DCT), क्वांटिज़ेशन और एंट्रॉपी कोडिंग सहित कई चरण शामिल होते हैं।
रंग स्थान रूपांतरण RGB रंग स्थान से इमेज डेटा को परिवर्तित करने की प्रक्रिया है, जो आमतौर पर डिजिटल कैमरों और कंप्यूटर डिस्प्ले में उप योग किया जाता है, YCbCr रंग स्थान में, जिसका उपयोग JPEG कंप्रेशन में किया जाता है। यह रूपांतरण इमेज को एक ल्यूमिनेंस घटक (Y) में अलग करता है, जो चमक के स्तर का प्रतिनिधित्व करता है, और दो क्रोमिनेंस घटक (Cb और Cr), जो रंग की जानकारी का प्रतिनिधित्व करते हैं। यह कंप्रेशन के लिए फायदेमंद है क्योंकि मानवीय आँख रंग की तुलना में चमक में बदलाव के प्रति अधिक संवेदनशील होती है, जिससे क्रोमिनेंस घटकों के अधिक आक्रामक कंप्रेशन की अनुमति मिलती है बिना कथित इमेज गुणवत्ता को महत्वपूर्ण रूप से प्रभावित किए।
सबसैंपलिंग एक ऐसी प्रक्रिया है जो ल्यूमिनेंस घटक के सापेक्ष क्रोमिनेंस घटकों के रिज़ॉल्यूशन को कम करके रंग विवरण के प्रति मानवीय आँख की कम संवेदनशीलता का लाभ उठाती है। सामान्य सबसैंपलिंग अनुपात में 4:4:4 (कोई सबसैंपलिंग नहीं), 4:2:2 (क्रोमिनेंस के क्षैतिज रिज़ॉल्यूशन को आधा करना), और 4:2:0 (क्षैतिज और ऊर्ध् वाधर दोनों रिज़ॉल्यूशन को आधा करना) शामिल हैं। सबसैंपलिंग अनुपात का चुनाव इमेज गुणवत्ता और फ़ाइल आकार के बीच संतुलन को प्रभावित कर सकता है।
असतत कोसाइन ट्रांसफ़ॉर्म (DCT) को इमेज के छोटे ब्लॉक (आमतौर पर 8x8 पिक्सेल) पर लागू किया जाता है ताकि स्थानिक डोमेन डेटा को फ़्रीक्वेंसी डोमेन में परिवर्तित किया जा सके। यह चरण JPEG कंप्रेशन के लिए महत्वपूर्ण है क्योंकि यह इमेज विवरण को अलग-अलग महत्व के घटकों में अलग करने की अनुमति देता है, जिसमें उच्च फ़्रीक्वेंसी घटक अक्सर मानवीय आँख के लिए कम बोधगम्य होते हैं। इन घटकों को तब क्वांटिज़ किया जा सकता है, या सटीकता में कम किया जा सकता है, ताकि कंप्रेशन प्राप्त किया जा सके।
क्वांटिज़ेशन मानों की एक श्रेणी को एकल क्वांटम मान में मैप करने की प्रक्रिया है, जो प्रभावी रूप से DCT गुण
यह कनवर्टर पूरी तरह से आपके ब्राउज़र में चलता है। जब आप किसी फ़ाइल का चयन करते हैं, तो उसे मेमोरी में पढ़ा जाता है और चयनित प्रारूप में परिवर्तित किया जाता है। फिर आप परिवर्तित फ़ाइल डाउनलोड कर सकते हैं।
रूपांतरण तुरंत शुरू हो जाते हैं, और अधिकांश फ़ाइलें एक सेकंड के भीतर परिवर्तित हो जाती हैं। बड़ी फ़ाइलों में अधिक समय लग सकता है।
आपकी फाइलें कभी भी हमारे सर्वर पर अपलोड नहीं की जाती हैं। वे आपके ब्राउज़र में परिवर्तित हो जाती हैं, और फिर परिवर्तित फ़ाइल डाउनलोड हो जाती है। हम आपकी फाइलें कभी नहीं देखते हैं।
हम जेपीईजी, पीएनजी, जीआईएफ, वेबपी, एसवीजी, बीएमपी, টিআইএফএফ, और अधिक सहित सभी छवि प्रारूपों के बीच रूपांतरण का समर्थन करते हैं।
यह कनवर्टर पूरी तरह से मुफ्त है, और हमेशा मुफ्त रहेगा। क्योंकि यह आपके ब्राउज़र में चलता है, हमें सर्वर के लिए भुगतान करने की आवश्यकता नहीं है, इसलिए हमें आपसे शुल्क लेने की आवश्यकता नहीं है।
हाँ! आप एक साथ जितनी चाहें उतनी फाइलें परिवर्तित कर सकते हैं। बस उन्हें जोड़ते समय कई फाइलों का चयन करें।