পটভূমি অপসারণ একটি বিষয়কে তার চারপাশ থেকে আলাদা করে যাতে আপনি এটিকে স্বচ্ছতার উপর স্থাপন করতে পারেন, দৃশ্যটি বদলাতে পারেন, বা এটিকে একটি নতুন ডিজাইনে সংমিশ্রণ করতে পারেন। হুডের নিচে আপনি একটি আলফা ম্যাট অনুমান করছেন—প্রতি পিক্সেলে 0 থেকে 1 পর্যন্ত একটি অস্বচ্ছতা—এবং তারপর ফোরগ্রাউন্ডকে অন্য কিছুর উপর আলফা-কম্পোজিটিং করছেন। এটি পোর্টার-ডাফ থেকে গণিত এবং "ফ্রিঞ্জ" এবং স্ট্রেইট বনাম প্রিমাল্টিপ্লাইড আলফা-এর মতো পরিচিত সমস্যাগুলির কারণ। প্রিমাল্টিপ্লিকেশন এবং লিনিয়ার রঙের উপর ব্যবহারিক নির্দেশনার জন্য, মাইক্রোসফটের Win2D নোট, সোরেন স্যান্ডম্যান, এবং লোমন্টের লিনিয়ার ব্লেন্ডিং-এর উপর লেখা দেখুন।
যদি আপনি ক্যাপচার নিয়ন্ত্রণ করতে পারেন, তবে পটভূমিকে একটি কঠিন রঙে (প্রায়শই সবুজ) রঙ করুন এবং সেই রঙটি কী আউট করুন। এটি দ্রুত, চলচ্চিত্র এবং সম্প্রচারে পরীক্ষিত এবং ভিডিওর জন্য আদর্শ। ট্রেড-অফগুলি হল আলো এবং পোশাক: রঙিন আলো প্রান্তে (বিশেষ করে চুল) ছড়িয়ে পড়ে, তাই দূষণকে নিরপেক্ষ করতে আপনি ডেসপিল সরঞ্জাম ব্যবহার করবেন। ভাল প্রাইমারগুলির মধ্যে রয়েছে Nuke-এর ডক্স, মিক্সিং লাইট, এবং একটি হাতে-কলমে ফিউশন ডেমো।
অগোছালো পটভূমি সহ একক চিত্রগুলির জন্য, ইন্টারেক্টিভ অ্যালগরিদমগুলির জন্য কয়েকটি ব্যবহারকারী ইঙ্গিত প্রয়োজন—যেমন, একটি আলগা আয়তক্ষেত্র বা স্ক্রিবল—এবং একটি সুস্পষ্ট মাস্কে একত্রিত হয়। ক্যানোনিকাল পদ্ধতি হল গ্র্যাবকাট (বইয়ের অধ্যায়), যা ফোরগ্রাউন্ড/ব্যাকগ্রাউন্ডের জন্য রঙের মডেল শেখে এবং সেগুলিকে আলাদা করার জন্য পুনরাবৃত্তিমূলকভাবে গ্রাফ কাট ব্যবহার করে। আপনি GIMP-এর ফোরগ্রাউন্ড সিলেক্ট-এ SIOX (ImageJ প্লাগইন)-এর উপর ভিত্তি করে একই ধরনের ধারণা দেখতে পাবেন।
ম্যাটিং wispy সীমানায় (চুল, পশম, ধোঁয়া, কাচ) ভগ্নাংশ স্বচ্ছতা সমাধান করে। ক্লাসিক ক্লোজড-ফর্ম ম্যাটিং একটি ট্রাইম্যাপ (নিশ্চিতভাবে-ফোরগ্রাউন্ড/নিশ্চিতভাবে-ব্যাকগ্রাউন্ড/অজানা) নেয় এবং শক্তিশালী প্রান্ত বিশ্বস্ততার সাথে আলফার জন্য একটি রৈখিক সিস্টেম সমাধান করে। আধুনিক ডিপ ইমেজ ম্যাটিং অ্যাডোব কম্পোজিশন-1K ডেটাসেটে (MMEditing ডক্স) নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেয়, এবং SAD, MSE, গ্রেডিয়েন্ট এবং কানেক্টিভিটি (ব েঞ্চমার্ক ব্যাখ্যাকারী) এর মতো মেট্রিক দিয়ে মূল্যায়ন করা হয়।
সম্পর্কিত সেগমেন্টেশন কাজও দরকারী: DeepLabv3+ একটি এনকোডার-ডিকোডার এবং অ্যাট্রাস কনভোলিউশন দিয়ে সীমানা পরিমার্জন করে (PDF); মাস্ক R-CNN প্রতি-উদাহরণ মাস্ক দেয় (PDF); এবং SAM (সেগমেন্ট এনিথিং) একটি প্রম্পটেবল ফাউন্ডেশন মডেল যা অপরিচিত ছবিতে জিরো-শট মাস্ক তৈরি করে।
একাডেমিক কাজ কম্পোজিশন-1K-এ SAD, MSE, গ্রেডিয়েন্ট, এবং কানেক্টিভিটি ত্রুটি রিপোর্ট করে। আপনি যদি একটি মডেল বাছাই করেন, তবে সেই মেট্রিকগুলি সন্ধান করুন (মেট্রিক সংজ্ঞা; ব্যাকগ্রাউন্ড ম্যাটিং মেট্রিক্স বিভাগ)। পোর্ট্রেট/ভিডিওর জন্য, MODNet এবং ব্যাকগ্রাউন্ড ম্যাটিং V2 শক্তিশালী; সাধারণ "স্যালিয়েন্ট অবজেক্ট" চিত্রগুলির জন্য, U2-Net একটি কঠিন বেসলাইন; কঠিন স্বচ্ছতার জন্য, FBA ক্লিনার হতে পারে।
G3 ইমেজ ফরম্যাট, যা প্রায়ই গ্রুপ 3 ফ্যাক্স এনকোডিংয়ের সাথে যুক্ত, হল কালো এবং সাদা ইমেজ কম্প্রেস করার একটি পদ্ধতি যা প্রাথমিকভাবে টেলিফোন লাইনের মাধ্যমে দলিলগুলির দক্ষতার সাথে প্রেরণের জন্য তৈরি করা হয়েছিল। প্রযুক্তির উন্ন তির সাথে সাথে, এর ব্যবহার ফ্যাক্সিমাইল ট্রান্সমিশনের বাইরেও প্রসারিত হয়েছে, নির্দিষ্ট ডকুমেন্ট ইমেজিং এবং স্টোরেজ সিস্টেমের ভিত্তি হিসাবে কাজ করেছে। ডকুমেন্ট ট্রান্সমিশন প্রযুক্তির বিবর্তনে G3 ফরম্যাটের গুরুত্বকে অতিরঞ্জিত করা যায় না; এটি ডিজিটাল যোগাযোগ নেটওয়ার্কের ব্যাপকভাবে গ্রহণের আগের যুগে পাঠ্য এবং গ্রাফিক তথ্যের দ্রুত, আরও দক্ষ যোগাযোগ সক্ষম করেছিল।
G3 এর দক্ষতার মূলটি হল মডিফাইড হাফম্যান (MH) এনকোডিংয়ের ব্যবহার, রান-লেন্থ এনকোডিং (RLE) এর একটি রূপ যা ছোট কোডগুলির সাথে একই পিক্সেলের (এই ক্ষেত্রে বিট) সিকোয়েন্স উপস্থাপন করে ডেটা কম্প্রেস করে। এই কৌশলের সারাংশ হল দলিলগুলিতে প্রায়শই পাওয়া পুনরাবৃত্তিমূলক প্যাটার্নগুলির সুযোগ নেওয়া, একটি লাইনের উপর প্রেরণ করার জন্য প্রয়োজনীয় ডেটার পরিমাণ হ্রাস করা। উদাহরণস্বরূপ, একটি সাধারণ দলিলে, বড় এলাকাগুলি সম্পূর্ণরূপে সাদা (খালি) বা কালো (টেক্সট) হতে পারে এবং প্রতিটি পিক্সেলের জন্য একটি বিট প্রেরণ করার পরিবর্তে, MH এনকোডিং একটি কোড প্রেরণ করে যা বলে "300 সাদা পিক্সেল" বা "15 কালো পিক্সেল," ডেটা আকারকে নাটকীয়ভাবে কমিয়ে দেয়।
এছাড়াও, G3 ফরম্যাট বেসলাইন MH এনকোডিংয়ের উপর একটি বিকল্প উন্নতি হিসাবে একটি দ্বি-মাত্রিক কোডিং স্কিম ব্যবহার করে। মডিফাইড READ (রিলেটিভ এলিমেন্ট অ্যাড্রেস ডিজাইনেট) নামে পরিচিত এই স্কিমটি এই সত্যের সুযোগ নেয় যে একটি দলিলের পরপর লাইনগুলি প্রায়শই অনুরূপ। MH কোডিংয়ের মতো প্রতিটি লাইনকে স্বাধীনভাবে এনকোড করার পরিবর্তে, মডিফাইড READ একটি লাইনকে তার পূর্বসূরীর সাথে তুলনা করে এবং কেবল পার্থক্যগুলি এনকোড করে। এই পদ্ধতিটি প্রায়শই উল্লেখযোগ্য কম্প্রেশন উন্নতির দিকে পরিচালিত করে, বিশেষ করে একই রঙের বড় এলাকা বা পুনরাবৃত্তিমূলক প্যাটার্ন সহ দলিলগুলির জ ন্য।
একটি G3 এনকোড করা দলিল পেজগুলিতে সাজানো থাকে, প্রতিটি পেজে একটি হেডার এবং এনকোড করা লাইনের একটি সিরিজ থাকে। হেডারে পেজ সম্পর্কে তথ্য থাকে, যেমন এর রেজোলিউশন, যা পরিবর্তিত হতে পারে তবে সাধারণত 204x98 বা 204x196 DPI (ডট প্রতি ইঞ্চি) এর স্ট্যান্ডার্ড ফ্যাক্স রেজোলিউশন অন্তর্ভুক্ত করে। এই নমনীয়তা G3 ফরম্যাটকে ইমেজের গুণমান এবং ফাইলের আকারের মধ্যে ভারসাম্য বজায় রাখতে দেয়, এটিকে বিভিন্ন ফ্যাক্সিংয়ের প্রয়োজন বা দলিলের ধরনের জন্য বহুমুখী করে তোলে। হেডারের পরে, প্রতিটি লাইনের জন্য এনকোড করা ডেটা ক্রমানুসারে সংরক্ষণ করা হয়, এন্ড-অফ-লাইন (EOL) কোডগুলি একটি লাইন থেকে পরবর্তী লাইনে রূপান্তর নির্দেশ করে।
G3 ফরম্যাটের উল্লেখযোগ্য বৈশিষ্ট্যগুলির মধ্যে একটি হল এর ত্রুটি পরিচালনা ক্ষমতা। এটি সম্ভাব্য অবিশ্বস্ত টেলিফোন লাইনের উপর ট্রান্সমিশনের জন্য ডিজাইন করা হয়েছিল বলে বিবেচনা করে, এটি ত্রুটি সনাক্ত এবং সংশোধন করার জন্য প্রক্রিয়া অন্তর্ভুক্ত করে। উদাহরণস্বরূপ, এনকোড করা ডেটার প্রতিটি লাইন চেক সিকোয়েন্স ব্যবহার করে সামঞ্জস্যের জন্য চেক করা যেতে পারে। যদি ট্রান্সমিশনের সময় কোনও লাইন দূষিত হওয়া পাওয়া যায়, তাহলে সিস্টেমটি লাইনের পুনরায় ট্রান্সমিশনের অনুরোধ করতে পারে, যার ফলে প্রাপ্ত দলিলের সততা নিশ্চিত হয়। একটি পেশাদার সেটিংয়ে দলিল ট্রান্সমিশনের নির্ভুলতা এবং নির্ভরযোগ্যতা বজায় রাখার জন্য G3 ফরম্যাটের এই দিকটি অত্যন্ত গুরুত্বপূর্ণ।
G3 এনকোডিং এবং ডিকোডিং বাস্তবায়নের জন্য ডেটা কম্প্রেশন কৌশল এবং ত্রুটি পরিচালনা কৌশলগুলির সাবধানতার সাথে বিবেচনা করা প্রয়োজন। একটি দলিলকে G3 ফরম্যাটে এনকোড করার জন্য ইমেজটি স্ক্যান করা, এটিকে একটি বাইনারি উপস্থাপনায় রূপান্তর করা (যেখানে প্রতিটি পিক্সেল কালো বা সাদা) এবং তারপরে ডেটা কম্প্রে স করার জন্য MH বা মডিফাইড READ এনকোডিং পদ্ধতি প্রয়োগ করা জড়িত। এক-মাত্রিক (MH) এবং দ্বি-মাত্রিক (মডিফাইড READ) এনকোডিং ব্যবহার করার মধ্যে পছন্দটি দলিলের বৈশিষ্ট্য এবং কম্প্রেশন দক্ষতা এবং কম্পিউটেশনাল জটিলতার মধ্যে পছন্দসই ভারসাম্যের উপর নির্ভর করে।
অন্যদিকে, ডিকোডিং জড়িত থাকে কম্প্রেসড G3 ডেটা নেওয়া এবং মূল ইমেজ পুনর্গঠন করা। এই প্রক্রিয়াটি MH বা মডিফাইড READ কোডগুলি সঠিকভাবে ব্যাখ্যা করতে হবে, ট্রান্সমিশন ত্রুটির সম্ভাবনা বিবেচনা করে। ডিকোডিং প্রক্রিয়ার সময় দেখা দিতে পারে এ
এই রূপান্তরকারীটি সম্পূর্ণভাবে আপনার ব্রাউজারে চলে। আপনি যখন একটি ফাইল নির্বাচন করেন, তখন এটি মেমরিতে পড়া হয় এবং নির্বাচিত ফর্ম্যাটে রূপান্তরিত হয়। তারপরে আপনি রূপান্তরিত ফাইলটি ডাউনলোড করতে পারেন।
রূপান্তর অবিলম্বে শুরু হয়, এবং বেশিরভাগ ফাইল এক সেকেন্ডের মধ্যে রূপান্তরিত হয়। বড় ফাইলগুলিতে বেশি সময় লাগতে পারে।
আপনার ফাইলগুলি কখনই আমাদের সার্ভারে আপলোড করা হয় না। সেগুলি আপনার ব্রাউজারে রূপান্তরিত হয় এবং তারপরে রূপান্তরিত ফাইলটি ডাউনলোড করা হয়। আমরা আপনার ফাইলগুলি কখনই দেখি না।
আমরা JPEG, PNG, GIF, WebP, SVG, BMP, TIFF এবং আরও অনেক কিছু সহ সমস্ত চিত্র ফর্ম্যাটের মধ্যে রূপান্তর সমর্থন করি।
এই রূপান্তরকারীটি সম্পূর্ণ বিনামূল্যে, এবং সর্বদা বিনামূল্যে থাকবে। যেহেতু এটি আপনার ব্রাউজারে চলে, তাই আমাদের সার্ভারের জন্য অর্থ প্রদান করতে হবে না, তাই আমাদের আপনাকে চার্জ করতে হবে না।
হ্যাঁ! আপনি একবারে যত খুশি ফাইল রূপান্তর করতে পারেন। যোগ করার সময় শুধু একাধিক ফাইল নির্বাচন করুন।