OCR, অথবা অপটিক্যাল ক্যারেক্টার রেকগনিশন হলো এক ধরনের প্রযুক্তি যা বিভিন্ন ধরনের ডকুমেন্টগুলিকে, যেমন স্ক্যান করা কাগজের ডকুমেন্ট, PDF ফাইল বা ডিজিটাল ক্যামেরায় তোলা ছবি, সম্পাদনযোগ্য এবং অনুসন্ধানযোগ্য তথ্যে রূপান্তর করতে ব্যবহার করা হয়। OCR এর প্রথম পর্যায়ে, একটি লেখা ডকুমেন্টের ছবি স্ক্যান করা হয়। এটি ছবি বা স্ক্যান করা দলিল হতে পারে। এই পর্যায়ের উদ্দেশ্য হলো দলিলের ডিজিটাল কপি তৈরি করা, এর পরিবর্তে ম্যানুয়াল লিপিবদ্ধকরণ চাই। এছাড়া, এই ডিজিটালায়ন প্রক্রিয়া মাশুল সম্পদের দীর্ঘায়িত্ব বাড়াতে হেল্প করতে পারে কারণ এটি ভাঙ্গুর সম্পদ হেন্ডল করার প্রয়োজনীয়তা হ্রাস করতে পারে। ডকুমেন্টটি ডিজিটালায়ন করা হলে, ওসিআর সফ্টওয়্যার ব্যবহার করে ছবিটি একক অক্ষরে প্রতিষ্ঠাপন করে। একে সেগমেন্টেশন প্রক্রিয়া বলে। সেগমেন্টেশন ডকুমেন্টটি লাইন, শব্দ এবং এত পর্যন্ত একক অক্ষর ভেঙে দেয়। এই বিভাজন একটি জটিল প্রক্রিয়া কারণ এতে অনেকগুলি প্রকেল সম্পৃক্ত হয় - ভিন্ন ফন্ট, ভিন্ন আকারের টেক্সট এবং টেক্সটের ভিন্ন কেলা, কেবল কিছু উল্লেখ করা উপযুক্ত। সেগমেন্টেশনের পরে, OCR এর এলগোরিদম প্যাটার্ন চিনতে প্রতি অক্ষর চিহ্নিত করে। প্রত্যেক অক্ষরের ক্ষেত্রে, এলগোরিদম তা অক্ষরের আকারের ডাটাবেসের সাথে তুলনা করে। সবচেয়ে কাছাকাছি মিল তবে অক্ষরের পরিচয় হিসাবে নির্বাচিত হয়। বৈশিষ্ট্য চিন্তার মধ্যে, ওসিআর এর আরও উন্নত রূপ, এলগোরিদম শেপ পরীক্ষা করে না শুধুমাত্র তাড়াহার এবং বাকয়া প্যাটার্নে লাইন এবং বক্রস্মিতি বিবেচনা করে। OCR এর এমন অনেকগুলি ব্যবহারিক অ্যাপ্লিকেশন রয়েছে -- মুদ্রিত ডকুমেন্ট ডিজিটাইজ করা থেকে, টেক্সট-টু-স্পিচ সেবা সক্রিয় করা, ডাটা এন্ট্রি প্রক্রিয়া স্বয়ংক্রিয় করা, এমনকি দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের পাঠ্যের সাথে ভালো করে যোগাযোগ করতে অসিস্ট করা। তবে, মনে রাখা দরকার যে OCR প্রক্রিয়াটি ব্যর্থ হতে পারে এবং বিশেষ করে কম রেজ্যুলেশনের ডকুমেন্ট, জটিল ফন্ট বা খারাপ মুদ্রিত টেক্সটের সাথে মারামারি করতে পারে। তাই, OCR সিস্টেমের যথার্থতা গুরুত্বপূর্ণভাবে পরিবর্তিত হয় মূল ডকুমেন্টের মান এবং ব্যবহৃত OCR সফ্টওয়্যারের বিশেষত্ব উপর নির্ভর করে। OCR হলো একটি গুরুত্বপূর্ণ প্রযুক্তি আধুনিক তথ্য উদ্ধার এবং ডিজিটালায়ন অভ্যাসে। এটি ম্যানুয়াল ডাটা এন্ট্রির প্রয়োজনীয়তা হ্রাস করে এবং শারীরিক ডকুমেন্টগুলি একটি ডিজিটাল ফর্ম্যাটে রূপান্তর করে একটি বিশ্বস্ত, কার্যকর প্রক্রিয়া প্রদান করে।
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) একটি প্রযুক্তি যা বিভিন্ন ধরনের দস্তাবেজ, যেমন স্ক্যান করা কাগজের দস্তাবেজ, PDF ফাইল বা ডিজিটাল ক্যামেরায় ছবি তৈরি করা, সম্পাদনযোগ্য এবং অনুসন্ধানযোগ্য তথ্যে রূপান্তর করতে ব্যবহৃত হয়।
OCR কাজ করে একটি ইনপুট ছবি বা দস্তাবেজ স্ক্যান করে, ছবিটি ব্যক্তিগত অক্ষরগুলিতে বিভক্ত করে এবং প্যাটার্ন নির্বাচন বা বৈশিষ্ট্য নির্বাচন ব্যবহার করে প্রতিটি অক্ষর অক্ষররূপের ডাটাবেসের সাথে তুলনা করে।
OCR বিভিন্ন খাতে এবং অ্যাপ্লিকেশনে ব্যবহার হয়, তারমধ্যে মুদ্রিত দস্তাবেজ ডিজিটাইজ করা, টেক্সট-টু-স্পিচ সেবা সক্রিয় করা, ডাটা এন্ট্রি প্রক্রিয়া স্বয়ংক্রিয় করা, এবং দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের টেক্সটের সাথে ভালোভাবে মিলিয়ে যাওয়ার অসিস্ট করা।
যদিও OCR প্রযুক্তিতে বড় উন্নতি হয়েছে, তবে এটি অব্যর্থ। মূল দস্তাবেজের গুণমান এবং OCR সফটওয়্যারের নির্দিষ্টতা উপর নির্ভর করে সঠিকতা বিভিন্ন হতে পারে।
যদিও OCR মূলত মুদ্রিত টেক্সটের জন্য নকল করা হয়, তবে কিছু উন্নত OCR সিস্টেম স্পষ্ট, সামান্য হাতের লেখা চিনতে ও সক্ষম। তবে, সাধারণত হাতে লেখা চিত্রগুলির চেনাচেনি কম সঠিক হয় কারণ ব্যক্তিগত লেখার শৈলীতে প্রচুর পরিবর্তন হয়।
হ্যাঁ, অনেক মাত্রায় OCR সফটওয়্যার সিস্টেম একাধিক ভাষা চেনে তুলতে পারে। তবে, আপনি যে সফটওয়্যার ব্যবহার করছেন, নিশ্চিত করুন যে নির্দিষ্ট ভাষাটি এটি দ্বারা সমর্থিত।
OCR মূলত Optical Character Recognition এর জন্য দাঁড়ায় এবং এটি মুদ্রিত টেক্সট চিনতে ব্যবহার করা হয়, যখনই ICR, অর্থাৎ Intelligent Character Recognition, আরও উন্নত এবং এটি হাতে লেখা টেক্সট চিনতে ব্যবহার করা হয়।
OCR সাধারণত স্পষ্ট, সহজে পড়া যাবে এমন ফন্ট এবং মান টেক্সট আকারের সাথে সেরা কাজ করে। যখন এটি বিভিন্ন ফন্ট এবং আকারের নিয়ে কাজ করে, তখন সেটি অস্বাভাবিক ফন্ট বা খুব ছোট টেক্সট আকারের নিয়ে সামোতীয়তা হ্রাস পায়।
OCR বিখ্যাত দস্তাবেজ, জটিল ফন্ট, খারাপ মুদ্রিত টেক্সট, হাতে লেখা, এবং দস্তাবে জ যা টেক্সটের সাথে বাধা দেয় দিয়ে হাতাহাতি করতে পারে। এছাড়াও, এটি অনেকগুলি ভাষায় কাজ করতে পারে, তবে এটি প্রতিটি ভাষা পূর্ণাঙ্গভাবে ছাড়া যেতে পারে।
হ্যাঁ, OCR বর্ণ টেক্সট এবং পটভূমি স্ক্যান করতে পারে, যদিও এটি সাধারণত উচ্চ-কন্ট্রাস্ট বর্ণ সংযোজনে অতিরিক্ত কার্যকর, যেমন সাদা পটভূমি উপর কালো টেক্সট। টেক্সট এবং পটভূমি রং যথেষ্ট বিপরীত না হলে সঠিকতা হ্রাস পেতে পারে।
JNG (JPEG Network Graphics) ফরম্যাট হল একটি ইমেজ ফাইল ফরম্যাট যা আরও ব্যাপকভাবে পরিচিত MNG (Multiple-image Network Graphics) ফরম্যাটের একটি সাব-ফরম্যাট হিসাবে ডিজাইন করা হয়েছিল। এটি প্রাথমিকভাবে একটি একক ইমেজ ফরম্যাটের মধ্যে লসি এবং লসলেস কম্প্রেশনের জন্য একটি সমাধান প্রদানের জন্য বিকশিত হয়েছিল, যা এর তৈরির সময় JPEG বা PNG এর মতো অন্যান্য সাধারণ ফরম্যাটের সাথে সম্ভব ছিল না। JNG ফাইলগুলি সাধারণত এমন ইমেজগুলির জন্য ব্যবহৃত হয় যার জন্য উচ্চ-মানের, ফটোগ্রাফিক-স্টাইলের উপস্থাপনা এবং স্বচ্ছতার জন্য একটি ঐচ্ছিক আলফা চ্যানেলের প্রয়োজন হয়, যা স্ট্যান্ডার্ড JPEG ইমেজ দ্বারা সমর্থিত নয়।
JNG একটি স্ট্যান্ডঅ্যালোন ফরম্যাট নয় তবে MNG ফাইল ফরম্যাট স্যুটের অংশ, যা PNG এর অ্যানিমেটেড সংস্করণ হিসাবে ডিজাইন করা হয়েছিল। MNG স্যুটে MNG এবং JNG উভয় ফরম্যাট অন্তর্ভুক্ত রয়েছে, MNG অ্যানিমেশন সমর্থন করে এবং JNG একটি একক-ইমেজ ফরম্যাট। JNG ফরম্যাটটি একই দল দ্বারা তৈরি করা হয়েছিল যারা PNG ফরম্যাটটি বিকাশ করেছিল এবং এটি একটি পৃথক আলফা চ্যানেলের সম্ভাবনা বজায় রেখে JPEG-কম্প্রেসড রঙের ডেটা যুক্ত করে PNG কে পরিপূরক করার উদ্দেশ্যে করা হয়েছিল, যা PNG সমর্থন করে কিন্তু JPEG করে না।
একটি JNG ফাইলের কাঠামো একটি MNG ফাইলের অনুরূপ, তবে এটি আরও সহজ কারণ এটি কেবল একক ইমেজের জন্য উদ্দেশ্যে করা হয়েছে। একটি JNG ফাইল একাধিক চাঙ্ক নিয়ে গঠিত, যার প্রতিটিতে একটি নির্দিষ্ট ধরনের ডেটা থাকে। একটি JNG ফাইলে সবচেয়ে গুরুত্বপূর্ণ চাঙ্কগুলি হল JHDR চাঙ্ক, যা হেডার তথ্য ধারণ করে; JDAT চাঙ্ক, যা JPEG-কম্প্রেসড ইমেজ ডেটা ধারণ করে; JSEP চাঙ্ক, যা JPEG ডেটা স্ট্রিমের শেষ নির্দেশ করার জন্য উপস্থিত থাকতে পারে; এবং আলফা চ্যানেল চাঙ্কগুলি, যা ঐচ্ছিক এবং IDAT চাঙ্ক (PNG-কম্প্রেসড আলফা ডেটা ধারণকারী) বা JDAA চাঙ্ক (JPEG-কম্প্রেসড আলফা ডেটা ধারণকারী) হতে পারে।
JHDR চাঙ্কটি একটি JNG ফাইলের প্রথম চাঙ্ক এবং এটি গুরুত্বপূর্ণ কারণ এটি ইমেজের বৈশিষ্ট্যগুলি সংজ্ঞায়িত করে। এটি ইমেজের প্রস্থ এবং উচ্চতা, রঙের গভীরতা, একটি আলফা চ্যানেল উপস্থিত রয়েছে কিনা, ব্যবহৃত রঙের স্থান এবং আলফা চ্যানেলের জন্য কম্প্রেশন পদ্ধতির মতো তথ্য অন্তর্ভুক্ত করে। এই চাঙ্কটি ডিকোডারগুলিকে বুঝতে দেয় যে ফাইলের মধ্যে পরবর্তী ডেটা কীভাবে প্রক্রিয়া করতে হবে।
JDAT চাঙ্কটি প্রকৃত ইমেজ ডেটা ধারণ করে, যা JPEG স্ট্যান্ডার্ড কম্প্রেশন কৌশল ব্যবহার করে কম্প্রেস করা হয়। এই কম্প্রেশন ফটোগ্রাফিক ইমেজগুলির দক্ষ স্টোরেজের অনুমতি দেয়, যা প্রায়শই জটিল রঙের গ্রেডিয়েন্ট এবং স্বরে সূক্ষ্ম বৈচিত্র ধারণ করে। JNG এর মধ্যে JPEG কম্প্রেশন স্ট্যান্ডঅ্যালোন JPEG ফাইলগুলিতে ব্যবহৃত কম্প্রেশনের মতোই, যা স্ট্যান্ডার্ড JPEG ডিকোডারগুলিকে পুরো JNG ফরম্যাটটি বুঝতে না পেরেও একটি JNG ফাইল থেকে ইমেজ ডেটা পড়ার অনুমতি দেয়।
যদি একটি JNG ইমেজে একটি আলফা চ্যানেল উপস্থিত থাকে, তবে এটি IDAT বা JDAA চাঙ্কগুলিতে সংরক্ষণ করা হয়। IDAT চাঙ্কগুলি PNG ফাইলগুলিতে ব্যবহৃত চাঙ্কগুলির মতোই এবং PNG-কম্প্রেসড আলফা ডেটা ধারণ করে। এটি আলফা চ্যানেলের লসলেস কম্প্রেশনের অনুমতি দেয়, যা নিশ্চিত করে যে স্বচ্ছতার তথ্য কোনও মানের ক্ষতি ছাড়াই সংরক্ষণ করা হয়েছে। অন্যদিকে, JDAA চাঙ্কগুলি JPEG-কম্প্রেসড আলফা ডেটা ধারণ করে, যা আলফা চ্যানেলে সম্ভাব্য লসি কম্প্রেশন আর্টিফ্যাক্টের মূল্যে ছোট ফাইলের আকারের অনুমতি দেয়।
JSEP চাঙ্কটি একটি ঐচ্ছিক চাঙ্ক যা JPEG ডেটা স্ট্রিমের শেষ নির্দেশ করে। এটি এমন ক্ষেত্রে কার্যকর যেখানে JNG ফাইলটি একটি নেটওয়ার্কের উপর স্ট্রিম করা হচ্ছে এবং ডিকোডারকে জানতে হবে কখন JPEG ডেটা পড়া বন্ধ করতে হবে এবং আলফা চ্যানেল ডেটা সন্ধান শুরু করতে হবে। এই চাঙ্কটি প্রয়োজন হয় না যদি ফাইলটি একটি স্থানীয় স্টোরেজ মাধ্যম থেকে পড়া হচ্ছে যেখানে JPEG ডেটার শেষটি ফাইলের কাঠামো থেকেই নির্ধারণ করা যেতে পারে।
JNG একটি ICCP চাঙ্ক অন্তর্ভুক্ত করে রঙ সংশোধনকেও সমর্থন করে, যা একটি এম্বেডেড ICC রঙের প্রোফাইল ধারণ করে। এই প্রোফাইলটি বিভিন্ন ডিভাইস জুড়ে সঠিক রঙের উপস্থাপনার অনুমতি দেয় এবং এটি বিশেষত এমন ইমেজগুলির জন্য গুরুত্বপূর্ণ যা বিভিন্ন স্ক্রিনে দেখা হবে বা মুদ্রিত হবে। রঙের ব্যবস্থাপনা ক্ষমতা অন্তর্ভুক্ত করা স্ট্যান্ডঅ্যালোন JPEG ফাইলগুলির উপর JNG ফরম্যাটের একটি উল্লেখযোগ্য সুবিধা, যা স্বাভাবিকভাবে এম্বেডেড রঙের প্রোফাইলগুলিকে সমর্থন করে না।
এর ক্ষমতা সত্ত্বেও, JNG ফরম্যাটটি ব্যাপকভাবে গৃহীত হয়নি। এটি আংশিকভাবে ফটোগ্রাফিক ইমেজগু
এই রূপান্তরকারী সম্পূর্ণ ভাবে আপনার ব্রাউজারে চলে। যখন আপনি একটি ফাইল নির্বাচন করেন, তা স্মৃতিতে পড়ে এবং নির্বাচিত ফর্ম্যাটে রূপান্তরিত হয়। আপনি তারপর রূপান্তরিত ফাইলটি ডাউনলোড করতে পারেন।
রূপান্তরগুলি তাৎক্ষণিকভাবে শুরু হয়, এবং বেশিরভাগ ফাইল এক সেকেন্ডের মধ্যে রূপান্তরিত হয়। বড় ফাইলগুলি আরও বেশি সময় নিতে পারে।
আপনার ফাইলগুলি কখনই আমাদের সার্ভারে আপলোড করা হয় না। তারা আপনার ব্রাউজারে রূপান্তরিত হয়, এবং রূপান্তরিত ফাইলটি তারপর ডাউনলোড করা হয়। আমরা কখনই আপনার ফাইলগুলি দেখি না।
আমরা সমস্ত চিত্র ফর্ম্যাটের মধ্যে রূপান্তর করার সমর্থন করি, যা অন্তর্ভুক্ত JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, এবং আরও অনেক কিছু।
এই রূপান্তরকারী সম্পূর্ণ বিনামূল্যে, এবং সর্বদা বিনামূল্যে থাকবে। কারণ এটি আপনার ব্রাউজারে চলে, আমাদের সার্ভারের জন্য পেমেন্ট করতে হয় না, তাই আমাদের আপনাকে চার্জ করার প্রয়োজন নেই।
হ্যাঁ! আপনি যত ফাইল চান তত একবারে রূপান্তর করতে পারেন। শুধু আপনি যখন তাদের যোগ করেন তখন একাধিক ফাইল নির্বাচন করুন।