পটভূমি অপসারণ একটি বিষয়কে তার চারপাশ থেকে আলাদা করে যাতে আপনি এটিকে স্বচ্ছতার উপর স্থাপন করতে পারেন, দৃশ্যটি বদলাতে পারেন, বা এটিকে একটি নতুন ডিজাইনে সংমিশ্রণ করতে পারেন। হুডের নিচে আপনি একটি আলফা ম্যাট অনুমান করছেন—প্রতি পিক্সেলে 0 থেকে 1 পর্যন্ ত একটি অস্বচ্ছতা—এবং তারপর ফোরগ্রাউন্ডকে অন্য কিছুর উপর আলফা-কম্পোজিটিং করছেন। এটি পোর্টার-ডাফ থেকে গণিত এবং "ফ্রিঞ্জ" এবং স্ট্রেইট বনাম প্রিমাল্টিপ্লাইড আলফা-এর মতো পরিচিত সমস্যাগুলির কারণ। প্রিমাল্টিপ্লিকেশন এবং লিনিয়ার রঙের উপর ব্যবহারিক নির্দেশনার জন্য, মাইক্রোসফটের Win2D নোট, সোরেন স্যান্ডম্যান, এবং লোমন্টের লিনিয়ার ব্লেন্ডিং-এর উপর লেখা দেখুন।
যদি আপনি ক্যাপচার নিয়ন্ত্রণ করতে পারেন, তবে পটভূমিকে একটি কঠিন রঙে (প্রায়শই সবুজ) রঙ করু ন এবং সেই রঙটি কী আউট করুন। এটি দ্রুত, চলচ্চিত্র এবং সম্প্রচারে পরীক্ষিত এবং ভিডিওর জন্য আদর্শ। ট্রেড-অফগুলি হল আলো এবং পোশাক: রঙিন আলো প্রান্তে (বিশেষ করে চুল) ছড়িয়ে পড়ে, তাই দূষণকে নিরপেক্ষ করতে আপনি ডেসপিল সরঞ্জাম ব্যবহার করবেন। ভাল প্রাইমারগুলির মধ্যে রয়েছে Nuke-এর ডক্স, মিক্সিং লাইট, এবং একটি হাতে-কলমে ফিউশন ডেমো।
অগোছালো পটভূমি সহ একক চিত্রগুলির জন্য, ইন্টারেক্টিভ অ্যালগরিদমগুলির জন্য কয়েকটি ব্যবহারকারী ইঙ্গিত প্রয়োজন—যেমন, একটি আলগা আয়তক্ষেত্র বা স্ক্রিবল—এবং একটি সুস্পষ্ট মাস্কে একত্রিত হয়। ক্যানোনিকাল পদ্ধতি হল গ্র্যাবকাট (বইয়ের অধ্যায়), যা ফোরগ্রাউন্ড/ব্যাকগ্রাউন্ডের জন্য রঙের মডেল শেখে এবং সেগুলিকে আলাদা করার জন্য পুনরাবৃত্তিমূলকভাবে গ্রাফ কাট ব্যবহার করে। আপনি GIMP-এর ফোরগ্রাউন্ড সিলেক্ট-এ SIOX (ImageJ প্লাগইন)-এর উপর ভিত্তি করে একই ধরনের ধারণা দেখতে পাবেন।
ম্যাটিং wispy সীমানায় (চুল, পশম, ধোঁয়া, কাচ) ভগ্নাংশ স্বচ্ছতা সমাধান করে। ক্লাসিক ক্লোজড-ফর্ম ম্যাটিং একটি ট্রাইম্যাপ (নিশ্চিতভাবে-ফোরগ্রাউন্ড/নিশ্চিতভাবে-ব্যাকগ্রাউন্ড/অজানা) নেয় এবং শক্তিশালী প্রান্ত বিশ্বস্ততার সাথে আলফার জন্য একটি রৈখিক সিস্টেম সমাধান করে। আধুনিক ডিপ ইমেজ ম্যাটিং অ্যাডোব কম্পোজিশন-1K ডেটাসেটে (MMEditing ডক্স) নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেয়, এবং SAD, MSE, গ্রেডিয়েন্ট এবং কানেক্টিভিটি (বেঞ্চমার্ক ব্যাখ্যাকারী) এর মতো মেট্রিক দিয়ে মূল্যায়ন করা হয়।
সম্পর্কিত সেগমেন্টেশন কাজও দরকারী: DeepLabv3+ একটি এনকোডার-ডিকোডার এবং অ্যাট্রাস কনভোলিউশন দিয়ে সীমানা পরিমার্জন করে (PDF); মাস্ক R-CNN প্রতি-উদাহরণ মাস্ক দেয় (PDF); এবং SAM (সেগমেন্ট এনিথিং) একটি প্রম্পটেবল ফাউন্ডেশন মডেল যা অপরিচিত ছবিতে জিরো-শট মাস্ক তৈরি করে।
একাডেমিক কাজ কম্পোজিশন-1K-এ SAD, MSE, গ্রেডিয়েন্ট, এবং কানেক্টিভিটি ত্রুটি রিপোর্ট করে। আপনি যদি একটি মডেল বাছাই করেন, তবে সেই মেট্রিকগুলি সন্ধান করুন (মেট্রিক সংজ্ঞা; ব্যাকগ্রাউন্ড ম্যাটিং মেট্রিক্স বিভাগ)। পোর্ট্রেট/ভিডিওর জন্য, MODNet এবং ব্যাকগ্রাউন্ড ম্যাটিং V2 শক্তিশালী; সাধারণ "স্যালিয়েন্ট অবজেক্ট" চিত্রগুলির জন্য, U2-Net একটি কঠিন বেসলাইন; কঠিন স্বচ্ছতার জন্য, FBA ক্লিনার হতে পা রে।
IPL (ইন্টারচেঞ্জেবল পিক্সেল লেয়ার) ইমেজ ফরম্যাট হল একটি তুলনামূলকভাবে কম পরিচিত ফরম্যাট, যা JPEG, PNG বা GIF এর মতো মূলধারার ইমেজ ফরম্যাটের তুলনায় কম পরিচিত। তবে, এটি নির্দিষ্ট অ্যাপ্লিকেশনগুলিতে একটি অনন্য উদ্দেশ্যে কাজ করে, বিশেষ করে সফ্টওয়্যার ডেভেলপমেন্ট, ইমেজ প্রসেসিং এবং কম্পিউটার গ্রাফিক্সের ক্ষেত্রে। IPL এমনভাবে ইমেজ ডেটা স্টোর করার জন্য ডিজাইন করা হয়েছে যা হাই-স্পিড ইমেজ প্রসেসিং এবং ম্যানিপুলেশনের জন্য উপযোগী, যা এটিকে রিয়েল-টাইম অ্যাপ্লিকেশনগুলির জন্য একটি আদর্শ পছন্দ করে তোলে যেখানে পারফরম্যান্স গুরুত্বপূর্ণ।
এর মূল কাঠামোতে, IPL ইমেজ ফরম্যাটটি এমনভাবে গঠন করা হয়েছে যা ইমেজ প্রসেসিংয়ে সাধারণ অপারেশনগুলির জন্য অত্যন্ত দক্ষ, যেমন কনভোলিউশ ন, ফিল্টারিং এবং জ্যামিতিক রূপান্তর। স্টোরেজের জন্য অপ্টিমাইজ করা ফরম্যাটগুলির (যেমন JPEG) বা ওয়েব ব্যবহারের জন্য (যেমন PNG) অপ্টিমাইজ করা ফরম্যাটগুলির বিপরীতে, IPL ইন-মেমরি অপারেশনগুলির জন্য অপ্টিমাইজ করা হয়েছে। এর অর্থ হল ফরম্যাটটি প্রাথমিকভাবে স্টোরেজ বা ট্রান্সমিশনের পরিবর্তে একটি প্রোগ্রামের রানটাইমের প্রসঙ্গে ব্যবহার করার জন্য ডিজাইন করা হয়েছে।
IPL ফরম্যাটের মূল বৈশিষ্ট্যগুলির মধ্যে একটি হল মাল্টিপল লেয়ার বা চ্যানেলের জন্য এর সমর্থন। প্রতিটি লেয়ার একটি ইমেজের বিভিন্ন উপাদানকে উপস্থাপন করতে পারে, যেমন রঙের চ্যানেল (লাল, সবুজ, নীল এবং স্বচ্ছতার জন্য আলফা), অথবা এগুলি সম্পূর্ণ ভিন্ন ইমেজগুলিকে উপস্থাপন করতে পারে যা কোনওভাবে সম্পর্কিত, যেমন একটি ভিডিও বা অ্যানিমেশনে ফ্রেমের একটি সিরিজ। এই মাল্টি-লেয়ার পদ্ধতি জটিল ইমেজ কম্পোজিশন এবং ম্যানিপুলেশনকে আরও দক্ষতার স াথে সম্পাদন করার অনুমতি দেয়।
IPL ফরম্যাটটি বিস্তৃত রেঞ্জের পিক্সেল ডেপথ এবং টাইপের জন্য এর সমর্থনের দ্বারাও চিহ্নিত করা হয়। এটি মনোক্রোম ইমেজ, 8-বিট গ্রেস্কেল ইমেজ এবং বিভিন্ন বিট ডেপথের সাথে পূর্ণ-রঙের ইমেজগুলি পরিচালনা করতে পারে। এই নমনীয়তা IPL-কে বিভিন্ন অ্যাপ্লিকেশনে ব্যবহার করার অনুমতি দেয়, সহজ বাইনারি ইমেজ বিশ্লেষণ থেকে জটিল রঙের ইমেজ প্রসেসিং পর্যন্ত। ফরম্যাটটি ফ্লোটিং-পয়েন্ট পিক্সেল মানগুলিকেও সামঞ্জস্য করতে পারে, যা বিশেষত বৈজ্ঞানিক এবং মেডিকেল ইমেজিং অ্যাপ্লিকেশনগুলির জন্য উপযোগী যেখানে নির্ভুলতা অত্যন্ত গুরুত্বপূর্ণ।
কাঠামোর দিক থেকে, একটি IPL ইমেজ ফাইলে সাধারণত একটি হেডার থাকে যা ইমেজের বৈশিষ্ট্যগুলি বর্ণনা করে, যেমন এর আকার (প্রস্থ এবং উচ্চতা), লেয়ারের সংখ্যা, পিক্সেল ডেপথ এবং ডেটা টাইপ। হেডারের পরে প্রকৃত পিক্সেল ডেটা থাকে, যা মেমরির একটি সংলগ্ন ব্লকে স্টোর করা হয়। এই লেআউট প্রসেসিংয়ের জন্য সুবিধাজনক কারণ এটি অতিরিক্ত পার্সিং বা ডিকোডিংয়ের প্রয়োজন ছাড়াই পিক্সেল ডেটাতে সরাসরি অ্যাক্সেসের অনুমতি দেয়।
একটি IPL ইমেজের পিক্সেল ডেটা প্রায়শই একটি প্ল্যানার ফরম্যাটে স্টোর করা হয়, যার অর্থ হল প্রতিটি লেয়ার বা চ্যানেল মেমরির একটি পৃথক সংলগ্ন ব্লকে স্টোর করা হয়। এটি ইন্টারলিভড ফরম্যাটের বিপরীতে, যেখানে একটি একক পিক্সেলের বিভিন্ন চ্যানেল একে অপরের পাশে স্টোর করা হয়। প্ল্যানার ফরম্যাটটি অনেক ইমেজ প্রসেসিং অ্যালগরিদমের জন্য উপকারী, যা সাধারণত একবারে একটি চ্যানেলে কাজ করে। প্রতিটি চ্যানেলকে পৃথকভাবে স্টোর করার মাধ্যমে, এই অ্যালগরিদমগুলি প্রসেসিংয়ের সময় চ্যানেলগুলিকে আলাদা করার ওভারহেড ছাড়াই আরও দক্ষতার সাথে চলতে পারে।
IPL ফরম্যাটের আরেকটি দিক যা এর দক্ষতায় অবদান রাখে তা হল কম্প্রেশনের অভাব। যদিও এর অর্থ হল IPL ফ াইলগুলি তাদের কম্প্রেসড প্রতিরূপের চেয়ে বড় হতে পারে, তবে এর অর্থ হল প্রসেসিংয়ের আগে ইমেজটি ডিকম্প্রেস করার প্রয়োজন নেই। এটি রিয়েল-টাইম অ্যাপ্লিকেশনগুলিতে একটি উল্লেখযোগ্য সুবিধা হতে পারে যেখানে ডিকম্প্রেশনের ওভারহেড নিষিদ্ধ হতে পারে। তবে, এর অর্থ হল IPL এমন অ্যাপ্লিকেশনগুলির জন্য উপযুক্ত নয় যেখানে স্টোরেজ স্পেস বা ব্যান্ডউইথ সীমিত।
IPL ফরম্যাটটি অঞ্চল অফ ইন্টারেস্ট (ROI) এর ধারণাকেও সমর্থন করে, যা একটি ইমেজের মধ্যে একটি সাবরিজিয়নের স্পেসিফিকেশনের অনুমতি দেয় যা প্রসেসিংয়ের জন্য বিশেষ আগ্রহের। একটি ROI সংজ্ঞায়িত করে, অ্যালগরিদমগুলি ইমেজের একটি ছোট অংশে ফোকাস করতে পারে, যা পারফরম্যান্স উন্নতির দিকে পরিচালিত করতে পারে কারণ প্রসেস করার জন্য কম ডেটা থাকে। এই বৈশিষ্ট্যটি বিশেষত অবজেক্ট সনাক্তকরণ এবং ট্র্যাকিংয়ের মতো অ্যাপ্লিকেশনগুলিতে উপযোগী, যেখানে
এই রূপান্তরকারী সম্পূর্ণ ভাবে আপনার ব্রাউজারে চলে। যখন আপনি একটি ফাইল নির্বাচন করেন, তা স্মৃতিতে পড়ে এবং নির্বাচিত ফর্ম্যাটে রূপান্তরিত হয়। আপনি তারপর রূপান্তরিত ফাইলটি ডাউনলোড করতে পারেন।
রূপান্তরগুলি তাৎক্ষণিকভাবে শুরু হয়, এবং বেশিরভাগ ফাইল এক সেকেন্ডের মধ্যে রূপান্তরিত হয়। বড় ফাইলগুলি আরও বেশি সময় নিতে পারে।
আপনার ফাইলগুলি কখনই আমাদের সার্ভারে আপলোড করা হয় না। তারা আপনার ব্রাউজারে রূপান্তরিত হয়, এবং রূপান্তরিত ফাইলটি তারপর ডাউনলোড করা হয়। আমরা কখনই আপনার ফাইলগুলি দেখি না।
আমরা সমস্ত চিত্র ফর্ম্যাটের মধ্যে রূপান্তর করার সমর্থন করি, যা অন্তর্ভুক্ত JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, এবং আরও অনেক কিছু।
এই রূপান্তরকারী সম্পূর্ণ বিনামূল্যে, এবং সর্বদা বিনামূল্যে থাকবে। কারণ এটি আপনার ব্রাউজারে চলে, আমাদের সার্ভারের জন্য পেমেন্ট করতে হয় না, তাই আমাদের আপনাকে চার্জ করার প্রয়োজন নেই।
হ্যাঁ! আপনি যত ফাইল চান তত একবারে রূপান্তর করতে পারেন। শুধু আপনি যখন তাদের যোগ করেন তখন একাধিক ফাইল নির্বাচন করুন।