অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) টেক্সটের ছবি—স্ক্যান, স্মার্টফোনের ছবি, পিডিএফ—মেশিন-পাঠযোগ্য স্ট্রিং এবং কাঠামোবদ্ধ ডেটাতে রূপান্তরিত করে। আধুনিক OCR একটি পাইপলাইন যা একটি ছবি পরিষ্কার করে, টেক্সট খুঁজে বের করে, তা পড়ে এবং সমৃদ্ধ মেটাডেটা রপ্তানি করে যাতে ডাউনস্ট্রিম সিস্টেমগুলি ডেটা অনুসন্ধান, সূচীকরণ বা নিষ্কাশন করতে পারে। দুটি বহুল ব্যবহৃত আউটপুট স্ট্যান্ডার্ড হলো hOCR, টেক্সট এবং লেআউটের জন্য একটি HTML মাইক্রোফরম্যাট, এবং ALTO XML, একটি লাইব্রেরি/আর্কাইভ-ভিত্তিক স্কিমা; উভয়ই অবস্থান, পড়ার ক্রম এবং অন্যান্য লেআউট সংকেত সংরক্ষণ করে এবং জনপ্রিয় ইঞ্জিন দ্বারা সমর্থিত Tesseract.
প্রিপ্রসেসিং। ওসিআর গুণমান ছবির পরিচ্ছন্নতার সাথে শুরু হয়: গ্রেস্কেল রূপান্তর, ডিনয়েজিং, থ্রেশহোল্ডিং (বাইনারাইজেশন), এবং ডেস্কিউইং। ক্যানোনিকাল OpenCV টিউটোরিয়ালগুলি গ্লোবাল, অভিযোজিত এবং Otsu থ্রেশহোল্ডিং—অমসৃণ আলো বা বাইমোডাল হিস্টোগ্রাম সহ নথিগুলির জন্য প্রধান। যখন একটি পৃষ্ঠার মধ্যে আলোকসজ্জা পরিবর্তিত হয় (ফোন স্ন্যাপের কথা ভাবুন), অভিযোজিত পদ্ধতিগুলি প্রায়শই একটি একক বিশ্বব্যাপী থ্রেশহোল্ডকে ছাড়িয়ে যায়; Otsu স্বয়ংক্রিয়ভাবে হিস্টোগ্রাম বিশ্লেষণ করে একটি থ্রেশহোল্ড বেছে নেয়। টিল্ট সংশোধন সমানভাবে গুরুত্বপূর ্ণ: Hough-ভিত্তিক ডেস্কিউইং (Hough লাইন ট্রান্সফর্ম) Otsu বাইনারাইজেশনের সাথে যুক্ত হয়ে প্রোডাকশন প্রিপ্রসেসিং পাইপলাইনগুলিতে একটি সাধারণ এবং কার্যকর পদ্ধতি।
সনাক্তকরণ বনাম স্বীকৃতি। OCR সাধারণত টেক্সট সনাক্তকরণ (টেক্সট কোথায় আছে?) এবং টেক্সট স্বীকৃতি (এতে কী লেখা আছে?)-এ বিভক্ত। প্রাকৃতিক দৃশ্য এবং অনেক স্ক্যানে, সম্পূর্ণ কনভোলিউশনাল ডিটেক্টর যেমন EAST ভারী প্রস্তাবনার পর্যায় ছাড়াই দক্ষতার সাথে শব্দ- বা লাইন-স্তরের চতুর্ভুজগুলির পূর্বাভাস দেয় এবং সাধারণ টুলকিটে (যেমন, OpenCV-এর পাঠ্য সনাক্তকরণ টিউটোরিয়াল) প্রয়োগ করা হয়। জটিল পৃষ্ঠাগুলিতে ( সংবাদপত্র, ফর্ম, বই), লাইন/অঞ্চলের বিভাজন এবং পড়ার ক্রম অনুমান গুরুত্বপূর্ণ:Kraken ঐতিহ্যগত জোন/লাইন বিভাজন এবং নিউরাল বেসলাইন বিভাজন প্রয়োগ করে, বিভিন্ন স্ক্রিপ্ট এবং দিকনির্দেশের (LTR/RTL/উল্লম্ব) জন্য সুস্পষ্ট সমর্থন সহ।
স্বীকৃতি মডেল। ক্লাসিক ওপেন সোর্স ওয়ার্কহরস Tesseract (Google দ্বারা ওপেন সোর্স করা হয়েছে, যার শিকড় HP-তে রয়েছে) একটি অক্ষর ক্লাসিফায়ার থেকে একটি LSTM-ভিত্তিক ক্রম শনাক্তকারীতে বিকশিত হয়েছে এবং অনুসন্ধানযোগ্য PDF, hOCR/ALTO-বান্ধব আউটপুটএবং CLI থেকে আরও অনেক কিছু নির্গত করতে পারে। আধুনিক শনাক্তকারীরা প্রাক-বিভক্ত অক্ষর ছাড়াই ক্রম মডেলিংয়ের উপর নির্ভর করে। Connectionist Temporal Classification (CTC) মৌলিক হিসাবে রয়ে গেছে, ইনপুট ফিচার সিকোয়েন্স এবং আউটপুট লেবেল স্ট্রিংগুলির মধ্যে প্রান্তিককরণ শেখা; এটি ব্যাপকভাবে হাতের লেখা এবং সিন-টেক্সট পাইপলাইনগুলিতে ব্যবহৃত হয়।
গত কয়েক বছরে, ট্রান্সফরমাররা OCR-কে নতুন আকার দিয়েছে। TrOCR একটি ভিশন ট্রান্সফরমার এনকোডার এবং একটি টেক্সট ট্রান্সফরমার ডিকোডার ব্যবহার করে, বৃহৎ সিন্থেটিক কর্পোরার উপর প্রশিক্ষিত এবং তারপর বাস্তব ডেটাতে ফাইন-টিউন করা হয়েছে, মুদ্রিত, হস্তলিখিত এবং সিন-টেক্সট বেঞ্চমার্ক জুড়ে শক্তিশালী செயல்திறন সহ (দেখুন Hugging Face ডক্স)। সমান্তরালভাবে, কিছু সিস্টেম ডাউনস্ট্রিম বোঝার জন্য OCR-কে এড়িয়ে যায়: Donut (Document Understanding Transformer) একটি OCR-মুক্ত এনকোডার-ডিকোডার যা সরাসরি স্ট্রাকচার্ড উত্তর (যেমন কী-মান JSON) ডকুমেন্ট ছবি থেকে আউটপুট করে (রিপো, মডেল কার্ড), যখন একটি পৃথক OCR পদক্ষেপ একটি IE সিস্টেমকে ফিড করে তখন ত্রুটি জমা হওয়া এড়িয়ে যায়।
আপনি যদি অনেক স্ক্রিপ্ট জুড়ে ব্যাটারি-সহ টেক্সট রিডিং চান, EasyOCR 80+ ভাষা মডেল সহ একটি সহজ API অফার করে, বাক্স, টেক্সট এবং কনফিডেন্স প্রদান করে—প্রোটোটাইপ এবং অ-ল্যাটিন স্ক্রিপ্টের জন্য সুবিধাজনক। ঐতিহাসিক নথিগুলির জন্য, Kraken বেসলাইন সেগমেন্টেশন এবং স্ক্রিপ্ট-সচেতন রিডিং অর্ডারের সাথে উজ্জ্বল; নমনীয় লাইন-স্তরের প্রশিক্ষণের জন্য, ক্যালামারি Ocropy বংশের উপর ভিত্তি করে (Ocropy) (মাল্টি-)LSTM+CTC শনাক্তকারী এবং কাস্টম মডেল ফাইন-টিউন করার জন্য একটি CLI সহ।
সাধারণীকরণ ডেটার উপর ন ির্ভর করে। হস্তাক্ষরের জন্য, IAM হস্তাক্ষর ডেটাবেস প্রশিক্ষণ এবং মূল্যায়নের জন্য লেখক-বৈচিত্র্যময় ইংরেজি বাক্য সরবরাহ করে; এটি লাইন এবং শব্দ শনাক্তকরণের জন্য একটি দীর্ঘস্থায়ী রেফারেন্স সেট। দৃশ্য পাঠ্যের জন্য, COCO-Text MS-COCO-এর উপর ব্যাপক টীকা স্তর স্থাপন করেছে, মুদ্রিত/হস্তাক্ষর, পাঠযোগ্য/অপঠযোগ্য, স্ক্রিপ্ট এবং সম্পূর্ণ প্রতিলিপি জন্য লেবেল সহ (এছাড়াও মূল প্রকল্প পৃষ্ঠাদেখুন)। ক্ষেত্রটি সিন্থেটিক প্রিট্রেনিংয়ের উপরও ব্যাপকভাবে নির্ভর করে: সিন্থটেক্সট ইন দ্য ওয়াইল্ড বাস্তবসম্মত জ্যামিতি এবং আলো সহ ফটোগ্রাফে পাঠ্য রেন্ডার করে, ডিটেক্টর এবং শনাক্তকারীদের প্রিট্রেন করার জন্য বিশাল পরিমাণে ডেটা সরবরাহ করে (রেফারেন্স কোড ও ডেটা)।
এর অধীনে প্রতিযোগিতা ICDAR-এর রোবাস্ট রিডিং মূল্যায়নকে ভিত্তি করে রাখে। সাম্প্রতিক কাজগুলি এন্ড-টু-এন্ড সনাক্তকরণ/পঠন এবং শব্দগুলিকে বাক্যাংশে সংযুক্ত করা সহ, অফিসিয়াল কোড রিপোর্টিং স্পষ্টতা/প্রত্যাহার/এফ-স্কোর, ইন্টারসেকশন-ওভার-ইউনিয়ন (IoU), এবং অক্ষর-স্তরের সম্পাদনা-দূরত্ব মেট্রিক্স—অনুশীলনকারীদের যা ট্র্যাক করা উচিত তা प्रतिबिंबित করে।
OCR খুব কমই প্লেইন টেক্সটে শেষ হয়। আর্কাইভ এবং ডিজিটাল লাইব্রেরি পছন্দ করে ALTO XML কারণ এটি বিষয়বস্তুর পাশাপাশি ভৌত বিন্যাস (স্থানাঙ্ক সহ ব্লক/লাইন/শব্দ) এনকোড করে এবং এটি METS প্যাকেজিংয়ের সাথে ভালভাবে জুটি বাঁধে। hOCR মাইক্রোফরম্যাট, বিপরীতে, একই ধারণাটি HTML/CSS-এ ocr_line এবং ocrx_word-এর মতো ক্লাস ব্যবহার করে এম্বেড করে, যা ওয়েব টুলিংয়ের মাধ্যমে প্রদর্শন, সম্পাদনা এবং রূপান্তর করা সহজ করে তোলে। Tesseract উভয়ই প্রকাশ করে—যেমন, CLI থেকে সরাসরি hOCR বা অনুসন্ধানযোগ্য PDF তৈরি করা (PDF আউটপুট গাইড); পাইথন র্যাপার যেমন pytesseract সুবিধা যোগ করে। hOCR এবং ALTO-এর মধ্যে অনুবাদ করার জন্য রূপান্তরকারী বিদ্যমান রয়েছে যখন সংগ্রহস্থলগুলির নির্দিষ্ট ইনজেশন মান থাকে—এই সংগৃহীত তালিকাটি দেখুন OCR ফাইল-ফরম্যাট টুল.
সবচেয়ে শক্তিশালী প্রবণতা হল অভিসৃতি: সনাক্তকরণ, স্বীকৃতি, ভাষা মডেলিং এবং এমনকি টাস্ক-নির্দিষ্ট ডিকোডিং একীভূত ট্রান্সফরমার স্ট্যাকগুলিতে মিশে যাচ্ছে। বৃহৎ সিন্থেটিক কর্পোরার উপর প্রি-ট্রেনিং একটি শক্তি গুণক হিসাবে রয়ে গেছে। OCR-মুক্ত মডেলগুলি যেখানে লক্ষ্যটি ভারbatim ট্রান্সক্রিপ্টের পরিবর্তে স্ট্রাকচার্ড আউটপুট, সেখানে আক্রমণাত্মকভাবে প্রতিযোগিতা করবে। হাইব্রিড স্থাপনারও আশা করুন: একটি হালকা ডিটেক্টর এবং দীর্ঘ-ফর্ম পাঠ্যের জন্য একটি TrOCR-স্টাইল শনাক্তকারী, এবং ফর্ম এবং রসিদের জন্য একটি ডোনাট-স্টাইল মডেল।
Tesseract (GitHub) · Tesseract ডক্স · hOCR স্পেক · ALTO পটভূমি · EAST ডিটেক্টর · OpenCV টেক্সট ডিটেকশন · TrOCR · Donut · COCO-Text · SynthText · Kraken · Calamari OCR · ICDAR RRC · pytesseract · IAM হস্তাক্ষর · OCR ফাইল-ফরম্যাট টুল · EasyOCR
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) একটি প্রযুক্তি যা বিভিন্ন ধরণের নথি, যেমন স্ক্যান করা কাগজের নথি, PDF ফাইল বা ডিজিটাল ক্যামেরা দিয়ে তোলা ছবি, সম্পাদনাযোগ্য এবং অনুসন্ধানযোগ্য ডেটাতে রূপান্তর করতে ব্যবহৃত হয়।
OCR কাজ করে একটি ইনপুট ছবি বা নথি স্ক্যান করে, ছবিটি আলাদা আলাদা অক্ষরে বিভক্ত করে এবং প্যাটার্ন রিকগনিশন বা ফিচার রিকগনিশন ব্যবহার করে প্রতিটি অক্ষরকে অক্ষররূপের ডাটাবেসের সাথে তুলনা করে।
OCR বিভিন্ন খাতে এবং অ্যাপ্লিকেশনে ব্যবহৃত হয়, যার মধ্যে রয়েছে মুদ্রিত নথি ডিজিটাইজ করা, টেক্সট-টু-স্পিচ পরিষেবা সক্রিয় করা, ডেটা এন্ট্রি প্রক্রিয়া স্বয়ংক্রিয় করা, এবং দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের টেক্সটের সাথে আরও ভালোভাবে ইন্টারঅ্যাক্ট করতে সহায়তা করা।
যদিও OCR প্রযুক্তিতে বড় উন্নতি হয়েছে, তবে এটি নির্ভুল নয়। মূল নথির গুণমান এবং ব্যবহৃত OCR সফটওয়্যারের নির্দিষ্টতার উপর নির্ভর করে সঠিকতা পরিবর্তিত হতে পারে।
যদিও OCR মূলত মুদ্রিত টেক্সটের জন্য তৈরি করা হয়েছে, তবে কিছু উন্নত OCR সিস্টেম স্পষ্ট, সামঞ্জস্যপূর্ণ হাতের লেখা চিনতে সক্ষম। তবে, সাধারণত হাতের লেখার শনাক্তকরণ কম সঠিক হয় কারণ ব্যক্তিগত লেখার শৈলীতে অনেক বৈচিত্র্য থাকে।
হ্যাঁ, অনেক OCR সফটওয়্যার সিস্টেম একাধিক ভাষা চিনতে পারে। তবে, আপনি যে সফটওয়্যার ব্যবহার করছেন, তাতে নির্দিষ্ট ভাষাটি সমর্থিত কিনা তা নিশ্চিত করা গুরুত্বপূর্ণ।
OCR-এর পূর্ণরূপ হলো অপটিক্যাল ক্যারেক্টার রিকগনিশন এবং এটি মুদ্রিত পাঠ্য শনাক্ত করতে ব্যবহৃত হয়, যেখানে ICR বা ইন্টেলিজেন্ট ক্যারেক্টার রিকগনিশন আরও উন্নত এবং হাতে লেখা পাঠ্য শনাক্ত করতে ব্যবহৃত হয়।
OCR সাধারণত স্পষ্ট, সহজে পড়া যায় এমন ফন্ট এবং স্ট্যান্ডার্ড টেক্সট আকারের সাথে সবচেয়ে ভালো কাজ করে। যদিও এটি বিভিন্ন ফন্ট এবং আকারের সাথে কাজ করতে পারে, তবে অস্বাভাবিক ফন্ট বা খুব ছোট টেক্সট আকারের ক্ষেত্রে সঠিকতা হ্রাস পায়।
OCR নিম্ন-রেজোলিউশন নথি, জটিল ফন্ট, খারাপভাবে মুদ্রিত টেক্সট, হাতের লেখা, এবং যে সব নথিতে টেক্সটের সাথে পটভূমি মিশে যায়, সেগুলির ক্ষেত্রে সমস্যায় পড়তে পারে। এছাড়াও, এটি অনেক ভাষায় কাজ করতে পারলেও, প্রতিটি ভাষা পুরোপুরি সমর্থন নাও করতে পারে।
হ্যাঁ, OCR রঙিন টেক্সট এবং পটভূমি স্ক্যান করতে পারে, যদিও এটি সাধারণত উচ্চ-কন্ট্র াস্ট রঙের সংমিশ্রণে বেশি কার্যকর, যেমন সাদা পটভূমির উপর কালো টেক্সট। টেক্সট এবং পটভূমির রঙে যথেষ্ট বৈসাদৃশ্য না থাকলে সঠিকতা হ্রাস পেতে পারে।
বি ফাইল ফরম্যাট, 'বিটস্ট্রিম ফরম্যাট' এর সংক্ষিপ্ত রূপ, একটি কন্টেইনার ফরম্যাট যা ডিজিটাল ভিডিও এবং অডিও ডেটা সংরক্ষণ এবং প্রেরণের জন্য ব্যবহৃত হয়। এটি 1990 এর দশকের প্রথম দিকে অডিও ভিডিও ইন্টারলিভ (AVI) ফরম্যাটের উত্তরসূরি হিসাবে তৈরি করা হয়েছিল, যার লক্ষ্য ছিল মাল্টিমিডিয়া কন্টেন্টের জন্য একটি আরও দক্ষ এবং নমনীয় কন্টেইনার প্রদান করা। বি ফরম্যাট তার পূর্বসূরীদের তুলনায় বেশ কয়েকটি সুবিধা প্রদান করে, যার মধ্যে রয়েছে উন্নত কম্প্রেশন, একাধিক অডিও এবং ভিডিও স্ট্রিমের জন্য সাপোর্ট এবং বিস্তৃত রেঞ্জের কোডেক পরিচালনা করার ক্ষমতা।
এর মূল অংশে, একটি বি ফাইল বিভিন্ন চাঙ্কের সমন্বয়ে গঠিত, প্রতিটিতে একটি নির্দিষ্ট ধরনের ডেটা থাকে। ফাইলটি একটি হেডার চাঙ্ক দিয়ে শুরু হয়, যা ফাইলের সামগ্রিক কাঠামো এবং বিষয়বস্তু সম্পর্কে মেটাডেটা প্রদান করে। এই হেডারে চাঙ্কের মোট সংখ্যা, প্রতিটি চাঙ্কের আকার এবং অডিও এবং ভিডিও স্ট্রিমের জন্য ব্যবহৃত কোডেকের মতো তথ্য অন্তর্ভুক্ত থাকে।
হেডারের পরে, ফাইলে একটি বা একাধিক 'স্ট্রিম চাঙ্ক' থাকে, প্রতিটি একটি একক অডিও বা ভিডিও স্ট্রিমকে উপস্থাপন করে। এই চাঙ্কগুলি প্রকৃত এনকোডেড মিডিয়া ডেটা সংরক্ষণ করে, স্ট্রিমের জন্য নির্দিষ্ট অতিরিক্ত মেটাডেটার সাথে, যেমন কোডেক প্যারামিটার, বিটরেট এবং রেজোলিউশন। বি ফরম্যাট অডিও এবং ভিডিও উভয়ের জন্য বিভিন্ন ধরনের কোডেককে সাপোর্ট করে, যার মধ্যে রয়েছে H.264, MPEG-4, AAC এবং MP3 এর মতো জনপ্রিয় পছন্দ।
বি ফরম্যাটের একটি মূল ব ৈশিষ্ট্য হল একটি একক ফাইলের মধ্যে একাধিক স্ট্রিমকে ইন্টারলিভ করার ক্ষমতা। এর অর্থ হল সমস্ত অডিও ডেটার পরে সমস্ত ভিডিও ডেটা সংরক্ষণ করার পরিবর্তে, ফাইলটি প্রতিটি স্ট্রিমের ছোট সেগমেন্টের মধ্যে বিকল্প হতে পারে। এই ইন্টারলিভিং প্লেব্যাক পারফরম্যান্স উন্নত করতে এবং বাফারিং কমাতে সাহায্য করে, কারণ প্লেয়ার একযোগে উভয় স্ট্রিম পড়তে এবং ডিকোড করতে পারে।
ফাইলের মধ্যে দক্ষ সন্ধান এবং নেভিগেশন সহজ করার জন্য, বি ফরম্যাট 'চাঙ্ক ইনডেক্স' নামে পরিচিত একটি ইনডেক্স স্ট্রাকচার ব্যবহার করে। এই ইনডেক্সটি সাধারণত ফাইলের শেষে সংরক্ষণ করা হয় এবং এতে একটি কন্টেন্টের টেবিল থাকে যা প্রতিটি চাঙ্ককে ফাইলের মধ্যে তার শুরুর অবস্থানের সাথে ম্যাপ করে। চাঙ্ক ইনডেক্সের সাথে পরামর্শ করে, একটি প্লেয়ার দ্রুত মিডিয়ার যেকোনো পছন্দসই পয়েন্টে অবস্থান নির্ণয় করতে এবং জাম্প করতে পারে, পুরো ফাইল টি স্ক্যান করার প্রয়োজন ছাড়াই।
বি ফরম্যাটে অতিরিক্ত মেটাডেটা এবং পরিপূরক তথ্য সংরক্ষণের জন্যও বিধান রয়েছে। এতে চ্যাপ্টার মার্কার, সাবটাইটেল, কাস্টম ট্যাগ এবং এমনকি এম্বেডেড ইমেজ বা আর্টওয়ার্কের মতো জিনিস অন্তর্ভুক্ত থাকতে পারে। এই অতিরিক্ত উপাদানগুলি মূল অডিও এবং ভিডিও স্ট্রিম থেকে আলাদা, ডেডিকেটেড চাঙ্কে সংরক্ষণ করা হয়।
বি ফরম্যাটের সুবিধাগুলির মধ্যে একটি হল এর দৃঢ়তা এবং ত্রুটি সহনশীলতা। ফাইল স্ট্রাকচারে বিভিন্ন ত্রুটি সনাক্তকরণ এবং সংশোধন প্রক্রিয়া অন্তর্ভুক্ত রয়েছে, যেমন চেকসাম এবং অপ্রয়োজনীয় ডেটা, ডেটা দূষণ থেকে রক্ষা করতে এবং সামান্য ফাইল ক্ষতির উপস্থিতিতেও স্মুথ প্লেব্যাক নিশ্চিত করতে সাহায্য করে।
বি ফরম্যাট ডিজিটাল মিডিয়া শিল্পে ব্যাপকভাবে গৃহীত হয়েছে, বিশেষ করে অনলাইন ভিডিও স্ট্রিমিং এবং বিতরণের জন্য। এর দক্ষ কম্প্রেশন, নমনীয় কন্টেইনার স ্ট্রাকচার এবং একাধিক স্ট্রিমের জন্য সাপোর্ট এটিকে ইন্টারনেটে উচ্চ-মানের ভিডিও কন্টেন্ট সরবরাহ করার জন্য উপযুক্ত করে তোলে। ইউটিউব এবং নেটফ্লিক্সের মতো অনেক জনপ্রিয় ভিডিও স্ট্রিমিং প্ল্যাটফর্ম এবং পরিষেবা তাদের ভিডিও কন্টেন্ট এনকোডিং এবং পরিবেশনের জন্য বি ফরম্যাটের উপর নির্ভর করে।
অনলাইন ভিডিওতে ব্যবহারের পাশাপাশি, বি ফরম্যাট বিভিন্ন অন্যান্য প্রসঙ্গেও ব্যবহৃত হয়েছে, যেমন ডিজিটাল ভিডিও ক্যামেরা, ভিডিও এডিটিং সফ্টওয়্যার এবং মাল্টিমিডিয়া প্লেব্যাক ডিভাইস। বিভিন্ন ধরনের কোডেক এবং প্ল্যাটফর্মের সাথে এর বহুমুখিতা এবং সামঞ্জস্যতা এর স্থায়ী জনপ্রিয়তায় অবদান রেখেছে।
বছরের পর বছর ধরে, ভিডিও প্রযুক্তির অগ্রগতি এবং পরিবর্তনশীল শিল্পের প্রয়োজনীয়তার সাথে তাল মিলিয়ে বি ফরম্যাট বেশ কয়েকটি সংশোধন এবং আপডেটের মধ্য দিয়ে গেছে। এই আপডেটগুলি নতুন কোডেক, উচ্চতর রেজোল িউশন এবং উন্নত কম্প্রেশন কৌশলের জন্য সাপোর্ট চালু করেছে, নিশ্চিত করে যে ফরম্যাটটি আধুনিক ভিডিও অ্যাপ্লিকেশনগুলির জন্য প্রাসঙ্গিক এবং দক্ষ রয়েছে।
MPEG-4 পার্ট 14 (MP4) এবং ম্যাট্রোস্কা (MKV)
এই রূপান্তরকারী সম্পূর্ণ ভাবে আপনার ব্রাউজারে চলে। যখন আপনি একটি ফাইল নির্বাচন করেন, তা স্মৃতিতে পড়ে এবং নির্বাচিত ফর্ম্যাটে রূপান্তরিত হয়। আপনি তারপর রূপান্তরিত ফাইলটি ডাউনলোড করতে পারেন।
রূপান্তরগুলি তাৎক্ষণিকভাবে শুরু হয়, এবং বেশিরভাগ ফাইল এক সেকেন্ডের মধ্যে রূপান্তরিত হয়। বড় ফাইলগুলি আরও বেশি সময় নিতে পারে।
আপনার ফাইলগুলি কখনই আমাদের সার্ভারে আপলোড করা হয় না। তারা আপনার ব্রাউজারে রূপান্তরিত হয়, এবং রূপান্তরিত ফাইলটি তারপর ডাউনলোড করা হয়। আমরা কখনই আপনার ফাইলগুলি দেখি না।
আমরা সমস্ত চিত্র ফর্ম্যাটের মধ্যে রূপান্তর করার সমর্থন করি, যা অন্তর্ভুক্ত JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, এবং আরও অনেক কিছু।
এই রূপান্তরকারী সম্পূর্ণ বিনামূল্যে, এবং সর্বদা বিনামূল্যে থাকবে। কারণ এটি আপনার ব্রাউজারে চলে, আমাদের সার্ভারের জন্য পেমেন্ট করতে হয় না, তাই আমাদের আপনাকে চার্জ করার প্রয়োজন নেই।
হ্যাঁ! আপনি যত ফাইল চান তত একবারে রূপান্তর করতে পারেন। শুধু আপনি যখন তাদের যোগ করেন তখন একাধিক ফাইল নির্বাচন করুন।