OCR, অথবা অপটিক্যাল ক্যারেক্টার রেকগনিশন হলো এক ধরনের প্রযুক্তি যা বিভিন্ন ধরনের ডকুমেন্টগুলিকে, যেমন স্ক্যান করা কাগজের ডকুমেন্ট, PDF ফাইল বা ডিজিটাল ক্যামেরায় তোলা ছবি, সম্পাদনযোগ্য এবং অনুসন্ধানযোগ্য তথ্যে রূপান্তর করতে ব্যবহার করা হয়। OCR এর প্রথম পর্যায়ে, একটি লেখা ডকুমেন্টের ছবি স্ক্যান করা হয়। এটি ছবি বা স্ক্যান করা দলিল হতে পারে। এই পর্যায়ের উদ্দেশ্য হলো দলিলের ডিজিটাল কপি তৈরি করা, এর পরিবর্তে ম্যানুয়াল লিপিবদ্ধকরণ চাই। এছাড়া, এই ডিজিটালায়ন প্রক্রিয়া মাশুল সম্পদের দীর্ঘায়িত্ব বাড়াতে হেল্প করতে পারে কারণ এটি ভাঙ্গুর সম্পদ হেন্ডল করার প্রয়োজনীয়তা হ্রাস করতে পারে। ডকুমেন্টটি ডিজিটালায়ন করা হলে, ওসিআর সফ্টওয়্যার ব্যবহার করে ছবিটি একক অক্ষরে প্রতিষ্ঠাপন করে। একে সেগমেন্টেশন প্রক্রিয়া বলে। সেগমেন্টেশন ডকুমেন্টটি লাইন, শব্দ এবং এত পর্যন্ত একক অক্ষর ভেঙে দেয়। এই বিভাজন একটি জটিল প্রক্রিয়া কারণ এতে অনেকগুলি প্রকেল সম্পৃক্ত হয় - ভিন্ন ফন্ট, ভিন্ন আকারের টেক্সট এবং টেক্সটের ভিন্ন কেলা, কেবল কিছু উল্লেখ করা উপযুক্ত। সেগমেন্টেশনের পরে, OCR এর এলগোরিদম প্যাটার্ন চিনতে প্রতি অক্ষর চিহ্নিত করে। প্রত্যেক অক্ষরের ক্ষেত্রে, এলগোরিদম তা অক্ষরের আকারের ডাটাবেসের সাথে তুলনা করে। সবচেয়ে কাছাকাছি মিল তবে অক্ষরের পরিচয় হিসাবে নির্বাচিত হয়। বৈশিষ্ট্য চিন্তার মধ্যে, ওসিআর এর আরও উন্নত রূপ, এলগোরিদম শেপ পরীক্ষা করে না শুধুমাত্র তাড়াহার এবং বাকয়া প্যাটার্নে লাইন এবং বক্রস্মিতি বিবেচনা করে। OCR এর এমন অনেকগুলি ব্যবহারিক অ্যাপ্লিকেশন রয়েছে -- মুদ্রিত ডকুমেন্ট ডিজিটাইজ করা থেকে, টেক্সট-টু-স্পিচ সেবা সক্রিয় করা, ডাটা এন্ট্রি প্রক্রিয়া স্বয়ংক্রিয় করা, এমনকি দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের পাঠ্যের সাথে ভালো করে যোগাযোগ করতে অসিস্ট করা। তবে, মনে রাখা দরকার যে OCR প্রক্রিয়াটি ব্যর্থ হতে পারে এবং বিশেষ করে কম রেজ্যুলেশনের ডকুমেন্ট, জটিল ফন্ট বা খারাপ মুদ্রিত টেক্সটের সাথে মারামারি করতে পারে। তাই, OCR সিস্টেমের যথার্থতা গুরুত্বপূর্ণভাবে পরিবর্তিত হয় মূল ডকুমেন্টের মান এবং ব্যবহৃত OCR সফ্টওয়্যারের বিশেষত্ব উপর নির্ভর করে। OCR হলো একটি গুরুত্বপূর্ণ প্রযুক্তি আধুনিক তথ্য উদ্ধার এবং ডিজিটালায়ন অভ্যাসে। এটি ম্যানুয়াল ডাটা এন্ট্রির প্রয়োজনীয়তা হ্রাস করে এবং শারীরিক ডকুমেন্টগুলি একটি ডিজিটাল ফর্ম্যাটে রূপান্তর করে একটি বিশ্বস্ত, কার্যকর প্রক্রিয়া প্রদান করে।
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) একটি প্রযুক্তি যা বিভিন্ন ধরনের দস্তাবেজ, যেমন স্ক্যান করা কাগজের দস্তাবেজ, PDF ফাইল বা ডিজিটাল ক্যামেরায় ছবি তৈরি করা, সম্পাদনযোগ্য এবং অনুসন্ধানযোগ্য তথ্যে রূপান্তর করতে ব্যবহৃত হয়।
OCR কাজ করে একটি ইনপুট ছবি বা দস্তাবেজ স্ক্যান করে, ছবিটি ব্যক্তিগত অক্ষরগুলিতে বিভক্ত করে এবং প্যাটার্ন নির্বাচন বা বৈশিষ্ট্য নির্বাচন ব্যবহার করে প্রতিটি অক্ষর অক্ষররূপের ডাটাবেসের সাথে তুলনা করে।
OCR বিভিন্ন খাতে এবং অ্যাপ্লিকেশনে ব্যবহার হয়, তারমধ্যে মুদ্রিত দস্তাবেজ ডিজিটাইজ করা, টেক্সট-টু-স্পিচ সেবা সক্রিয় করা, ডাটা এন্ট্রি প্রক্রিয়া স্বয়ংক্রিয় করা, এবং দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের টেক্সটের সাথে ভালোভাবে মিলিয়ে যাওয়ার অসিস্ট করা।
যদিও OCR প্রযুক্তিতে বড় উন্নতি হয়েছে, তবে এটি অব্যর্থ। মূল দস্তাবেজের গুণমান এবং OCR সফটওয়্যারের নির্দিষ্টতা উপর নির্ভর করে সঠিকতা বিভিন্ন হতে পারে।
যদিও OCR মূলত মুদ্রিত টেক্সটের জন্য নকল করা হয়, তবে কিছু উন্নত OCR সিস্টেম স্পষ্ট, সামান্য হাতের লেখা চিনতে ও সক্ষম। তবে, সাধারণত হাতে লেখা চিত্রগুলির চেনাচেনি কম সঠিক হয় কারণ ব্যক্তিগত লেখার শৈলীতে প্রচুর পরিবর্তন হয়।
হ্যাঁ, অনেক মাত্রায় OCR সফটওয়্যার সিস্টেম একাধিক ভাষা চেনে তুলতে পারে। তবে, আপনি যে সফটওয়্যার ব্যবহার করছেন, নিশ্চিত করুন যে নির্দিষ্ট ভাষাটি এটি দ্বারা সমর্থিত।
OCR মূলত Optical Character Recognition এর জন্য দাঁড়ায় এবং এটি মুদ্রিত টেক্সট চিনতে ব্যবহার করা হয়, যখনই ICR, অর্থাৎ Intelligent Character Recognition, আরও উন্নত এবং এটি হাতে লেখা টেক্সট চিনতে ব্যবহার করা হয়।
OCR সাধারণত স্পষ্ট, সহজে পড়া যাবে এমন ফন্ট এবং মান টেক্সট আকারের সাথে সেরা কাজ করে। যখন এটি বিভিন্ন ফন্ট এবং আকারের নিয়ে কাজ করে, তখন সেটি অস্বাভাবিক ফন্ট বা খুব ছোট টেক্সট আকারের নিয়ে সামোতীয়তা হ্রাস পায়।
OCR বিখ্যাত দস্তাবেজ, জটিল ফন্ট, খারাপ মুদ্রিত টেক্সট, হাতে লেখা, এবং দস্তাবে জ যা টেক্সটের সাথে বাধা দেয় দিয়ে হাতাহাতি করতে পারে। এছাড়াও, এটি অনেকগুলি ভাষায় কাজ করতে পারে, তবে এটি প্রতিটি ভাষা পূর্ণাঙ্গভাবে ছাড়া যেতে পারে।
হ্যাঁ, OCR বর্ণ টেক্সট এবং পটভূমি স্ক্যান করতে পারে, যদিও এটি সাধারণত উচ্চ-কন্ট্রাস্ট বর্ণ সংযোজনে অতিরিক্ত কার্যকর, যেমন সাদা পটভূমি উপর কালো টেক্সট। টেক্সট এবং পটভূমি রং যথেষ্ট বিপরীত না হলে সঠিকতা হ্রাস পেতে পারে।
JPEG, যা Joint Photographic Experts Group এর জন্য দাঁড়িয়েছে, ডিজিটাল ইমেজের জন্য লসি কম্প্রেশনের একটি সাধারণত ব্যবহৃত পদ্ধতি, বিশেষ করে ডিজিটাল ফটোগ্রাফি দ্বারা উৎপাদিত ইমেজগুলির জন্য। কম্প্রেশনের ডিগ্রি সামঞ্জস্য করা যেতে পারে, স্টোরেজ সাইজ এবং ইমেজের গুণমানের মধ্যে একটি নির্বাচনযোগ্য ট্রেড-অফের অনুমতি দেয়। JPEG সাধারণত ইমেজের গুণমানে সামান্য অনুধাবনযোগ্য ক্ষতির সাথে 10:1 কম্প্রেশন অর্জন করে। JPEG কম্প্রেশন অ্যালগরিদম JPEG ফাইল ফরম্যাটের মূল অংশে রয়েছে, যা আনুষ্ঠানিকভাবে JPEG Interchange Format (JIF) হিসাবে পরিচিত। যাইহোক, 'JPEG' শব্দটি প্রায়শই ফাইল ফরম্যাটকে বোঝাতে ব্যবহৃত হয় যা আসলে JPEG File Interchange Format (JFIF) হিসাবে মানক করা হয়েছে।
JPEG ফরম্যাট বিভিন্ন রঙের স্পেসকে সমর্থন করে, তবে ডিজিটাল ফটোগ্রাফি এবং ওয়েব গ্রাফিক্সে ব্যবহৃত সবচেয়ে সাধারণটি হল 24-বিট রঙ, যার মধ্যে লাল, সবুজ এবং নীল (RGB) উপাদানগুলির জন্য প্রতিটিতে 8 বিট রয়েছে। এটি 16 মিলিয়নেরও বেশি বিভিন্ন রঙের অনুমতি দেয়, যা বিস্তৃত পরিসরের অ্যাপ্লিকেশনের জন্য উপযুক্ত সমৃদ্ধ এবং উজ্জ্বল ইমেজের গুণমান সরবরাহ করে। JPEG ফাইলগুলি গ্রে-স্কেল ইমেজ এবং YCbCr এর মতো রঙের স্পেসকেও সমর্থন করতে পারে, যা প্রায়শই ভিডিও কম্প্রেশনে ব্যবহৃত হয়।
JPEG কম্প্রেশন অ্যালগরিদমটি ডিসক্রিট কোসাইন ট্রান্সফর্ম (DCT) এর উপর ভিত্তি করে, যা একটি ধরনের ফোরিয়ার ট্রান্সফর্ম। DCT ইমেজের ছোট ব্লকগুলিতে প্রয়োগ করা হয়, সাধারণত 8x8 পিক্সেল, স্পেসিয়াল ডোমেন ডেটাকে ফ্রিকোয়েন্সি ডোমেন ডেটাতে রূপান্তরিত করে। এই প্রক্রিয়াটি সুবিধাজনক কারণ এটি ইমেজের শক্তিকে কয়েকটি নিম্ন-ফ্রিকোয়েন্সি উপাদানে কেন্দ্রীভূত করার প্রবণতা রাখে, যা ইমেজের সামগ্রিক চেহারার জন্য আরও গুরুত্বপূর্ণ, যখন উচ্চ-ফ্রিকোয়েন্সি উপাদানগুলি, যা সূক্ষ্ম বিবরণে অবদান রাখে এবং অনুধাবনযোগ্য গুণমানের উপর কম প্রভাব ফেলে বাদ দেওয়া যেতে পারে, হ্রাস করা হয়।
DCT প্রয়োগ করার পরে, ফলস্বরূপ সহগগুলি পরিমাণিত হয়। পরিমাণ নির্ধারণ হল ইনপুট মানগুলির একটি বড় সেটকে একটি ছোট সেটে ম্যাপ করার প্রক্রিয়া, যা কার্যকরভ াবে DCT সহগগুলির সূক্ষ্মতা হ্রাস করে। এখানেই JPEG এর লসি দিকটি কাজে আসে। পরিমাণ নির্ধারণের ডিগ্রি একটি পরিমাণ নির্ধারণ টেবিল দ্বারা নির্ধারিত হয়, যা ইমেজের গুণমান এবং কম্প্রেশন অনুপাতের ভারসাম্য রক্ষার জন্য সামঞ্জস্য করা যেতে পারে। উচ্চতর স্তরের পরিমাণ নির্ধারণের ফলে উচ্চতর কম্প্রেশন এবং নিম্ন ইমেজের গুণমান হয়, যখন নিম্ন স্তরের পরিমাণ নির্ধারণের ফলে নিম্ন কম্প্রেশন এবং উচ্চতর ইমেজের গুণমান হয়।
সহগগুলি পরিমাণ নির্ধারণ করা হলে, তারপরে সেগুলি একটি জিগজ্যাগ অর্ডারে সিরিয়ালাইজ করা হয়, শীর্ষ-বাম কোণ থেকে শুরু করে এবং 8x8 ব্লকের মধ্য দিয়ে একটি জিগজ্যাগ প্যাটার্ন অনুসরণ করে। এই পদক্ষেপটি ব্লকের শুরুতে নিম্ন-ফ্রিকোয়েন্সি সহগ এবং শেষের দিকে উচ্চ-ফ্রিকোয়েন্সি সহগ স্থাপন করার জন্য ডিজাইন করা হয়েছে। যেহেতু পরিমাণ নির্ধারণের পরে অনেকগুলি উচ্চ-ফ্রিকোয়েন্সি সহগ শূন্য বা শূন্যের কাছাকাছি হওয়ার সম্ভাবনা রয়েছে, এই ক্রমবিন্যাসটি একই মানগুলিকে একত্রিত করে ডেটা আরও সংকুচিত করতে সহায়তা করে।
JPEG কম্প্রেশন প্রক্রিয়ার পরবর্তী পদক্ষেপটি এনট্রপি কোডিং, যা লসলেস কম্প্রেশনের একটি পদ্ধতি। JPEG-তে ব্যবহৃত এনট্রপি কোডিংয়ের সবচেয়ে সাধারণ রূপ হল হাফম্যান কোডিং, যদিও অ্যারিথমেটিক কোডিংও একটি বিকল্প। হাফম্যান কোডিং আরও ঘন ঘন মানগুলিতে ছোট কোড এবং কম ঘন ঘন মানগুলিতে দীর্ঘ কোড বরাদ্দ করে কাজ করে। যেহেতু পরিমাণ নির্ধারিত DCT সহগগুলি এমনভাবে সাজানো থাকে যা শূন্য এবং নিম্ন-ফ্রিকোয়েন্সি মানগুলিকে গোষ্ঠী করে, হাফম্যান কোডিং কার্যকরভাবে ডেটার আকার হ্রাস করতে পারে।
JPEG ফাইল ফরম্যাট ফাইলের মধ্যে মেটাডেটা সঞ্চয় করার অনুমতি দেয়, যেমন Exif ডেটা যা ক্যামেরার সেটিংস, ক্যাপচারের তারিখ এবং সময় এবং অন্যান্য প্রাসঙ্গিক বিবরণ সম্পর্কে তথ্য অন্তর্ভুক ্ত করে। এই মেটাডেটা JPEG ফাইলের অ্যাপ্লিকেশন-নির্দিষ্ট সেগমেন্টে সঞ্চয় করা হয়, যা বিভিন্ন সফ্টওয়্যার দ্বারা ইমেজের তথ্য প্রদর্শন বা প্রক্রিয়া করার জন্য পড়া যেতে পারে।
JPEG ফরম্যাটের মূল বৈশিষ্ট্যগুলির মধ্যে একটি হল প্রগতিশীল এনকোডিংয়ের জন্য এর সমর্থন। একটি প্রগতিশীল JPEG-তে, ইমেজটি ক্রমবর্ধমান বিস্তারিতের একাধিক পাসে এনকোড করা হয়। এর অর্থ হল ইমেজটি সম্পূর্ণরূপে ডাউনলোড না হলেও, পুরো ইমেজের একটি রুক্ষ সংস্করণ প্রদর্শন করা যেতে পারে, যা আরও ডেটা পাওয়ার সাথে সাথে ধীরে ধীরে গুণমান
এই রূপান্তরকারী সম্পূর্ণ ভাবে আপনার ব্রাউজারে চলে। যখন আপনি একটি ফাইল নির্বাচন করেন, তা স্মৃতিতে পড়ে এবং নির্বাচিত ফর্ম্যাটে রূপান্তরিত হয়। আপনি তারপর রূপান্তরিত ফাইলটি ডাউনলোড করতে পারেন।
রূপান্তরগুলি তাৎক্ষণিকভাবে শুরু হয়, এবং বেশিরভাগ ফাইল এক সেকেন্ডের মধ্যে রূপান্তরিত হয়। বড় ফাইলগুলি আরও বেশি সময় নিতে পারে।
আপনার ফাইলগুলি কখনই আমাদের সার্ভারে আপলোড করা হয় না। তারা আপনার ব্রাউজারে রূপান্তরিত হয়, এবং রূপান্তরিত ফাইলটি তারপর ডাউনলোড করা হয়। আমরা কখনই আপনার ফাইল গুলি দেখি না।
আমরা সমস্ত চিত্র ফর্ম্যাটের মধ্যে রূপান্তর করার সমর্থন করি, যা অন্তর্ভুক্ত JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, এবং আরও অনেক কিছু।
এই রূপান্তরকারী সম্পূর্ণ বিনামূল্যে, এবং সর্বদা বিনামূল্যে থাকবে। কারণ এটি আপনার ব্রাউজারে চলে, আমাদের সার্ভারের জন্য পেমেন্ট করতে হয় না, তাই আমাদের আপনাকে চার্জ করার প্রয়োজন নেই।
হ্যাঁ! আপনি যত ফাইল চান তত একবারে রূপান্তর করতে পারেন। শুধু আপনি যখন তাদের যোগ করেন তখন একাধিক ফাইল নির্বাচন করুন।