OCR, या ऑप्टिकल कैरेक्टर रिकग्निशन, एक प्रौद्योगिकी है जिसका उपयोग विभिन्न प्रकार के दस्तावेज़ों, जैसे कि स्कैन किए गए कागज़ी दस्तावेज़, PDF फ़ाइलें या डिजिटल कैमरे द्वारा कैप्चर की गई छवियों, को संपादन योग्य और खोजनेयोग्य डेटा में परिवर्तित करने के लिए किया जाता है।
OCR के पहले चरण में, पाठ दस्तावेज़ की एक छवि स्कैन की जाती है। यह एक फ़ोटो या स्कैन किया गया दस्तावेज़ हो सकता है। इस चरण का उद्देश्य यह है कि दस्तावेज़ की एक डिजिटल प्रतिलिपि बनाई जाए, मैन्युअल ट्रांसक्रिप्शन की आवश्यकता के बजाय। इसके अलावा, यह डिजिटाइजेशन प्रक्रिया सामग्री की लंबावधि को बढ़ाने में भी मदद कर सकती है क्योंकि यह नाज़ुक संसाधनों के हैंडलिंग को कम कर सकती है।
एक बार जब दस्तावेज़ को डिजिटलीकृत कर दिया जाता है, तो OCR सॉफ़्टवेयर छवि को पहचान के लिए व्यक्तिगत वर्णों में अलग करता है। इसे सेगमेंटेशन प्रक्रिया कहा जाता है। सेगमेंटेशन दस्तावेज़ को लाइनों, शब्दों और फिर अंतिम रूप में व्यक्तिगत वर्णों में तोड़ता है। यह विभाजन एक जटिल प्रक्रिया होती है क्योंकि इसमें असंख्य कारक शामिल होते हैं - विभिन्न फ़ॉन्ट, विभिन्न आकार के पाठ, और टेक्स्ट के विभिन्न संरेखण, केवल कुछ नाम लिए।
सेगमेंटेशन के बाद, OCR एल्गोरिदम फिर पैटर्न पहचान का उपयोग करके प्रत्येक व्यक्तिगत वर्ण की पहचान करता है। प्रत्येक वर्ण के लिए, एल्गोरिदम इसे वर्ण आकार के डाटाबेस से तुलना करेगा। सबसे करीबी मिलान फिर वर्ण की पहचान के रूप में चयनित होता है। फीचर पहचान में, OCR का एक और उन्नत रूप, एल्गोरिदम न केवल आकार की जांच करता है बल्कि पैटर्न में रेखाओं और वक्रों को भी ध्यान में लेता है।
OCR के अनेक व्यावहारिक अनुप्रयोग हैं - मुद्रित दस्तावेज़ों को डिजिटलीकरण से लेकर, टेक्स्ट-तो-स्पीच सेवाओं को सक्षम करने, डेटा प्रवेश प्रक्रियाओं को स्वचालित करने, से लेकर दृष्टिहीन उपयोगकर्ताओं को पाठ के साथ बेहतर इंटरैक्ट करने में सहायता करने तक। हालांकि, यह ध्यान देने योग्य है कि OCR प्रक्रिया अचूक नहीं होती है और विशेष रूप से निम्न-रिज़ॉल्यूशन दस्तावेजों, जटिल फ़ॉन्ट, या बेढंगा मुद्रित पाठ के साथ उपचार करते समय त्रुटियाँ कर सकती है। इसलिए, OCR सिस्टमों की सटीकता मूल दस्तावेज़ की गुणवत्ता और OCR सॉफ़्टवेयर का विशिष्ट विवरण पर अधिकार है।
OCR एक महत्वपूर्ण प्रौद्योगिकी है आधुनिक डेटा निकासी और डिजिटलीकरण प्रचारों में। यह मैन्युअल डेटा प्रवेश की आवश्यकता को कम करके और भौतिक दस्तावेजों को डिजिटल प्रारूप में परिवर्तित करने का एक विश्वसनीय, कुशल तरीका प्रदान करके संसाधनों का काफी समय और बचत करती है।
ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) एक प्रौद्योगिकी है जिसका उपयोग विभिन्न प्रकार के दस्तावेज़ों, जैसे कि स्कैन किए गए कागज के दस्तावेज, PDF फ़ाइलें या डिजिटल कैमरा द्वारा कैप्चर किए गए छवियों, को संपादन योग्य और खोजनीय डाटा में परिवर्तित करने के लिए उपयोग होता है।
OCR एक इनपुट छवि या दस्तावेज को स्कैन करके, इमेज को व्यक्तिगत वर्णों में बांटकर, और पैटर्न पहचान या विशेषता पहचान का उपयोग करके प्रत्येक वर्ण की तुलना करके काम करता है।
OCR का उपयोग विभिन्न क्षेत्रों और अनुप्रयोगों में उपयोग किया जाता है, जैसे कि मुद्रित दस्तावेजों को डिजिटाइज करना, टेक्स्ट-टू-स्पीच सेवाओं को सक्षम करना, डाटा एंट्री प्रक्रियाओं को स्वचालित करना, और दृष्टिहीन उपयोगकर्ताओं को पाठ से बेहतर बातचीत करने में सहायता करना।
हालांकि OCR प्रौद्योगिकी में महान प्रगति की गई है, लेकिन यह अफसोसवार नहीं है। सत्यापन मूल दस्तावेज की गुणवत्ता और OCR सॉफ़्टवेयर की विशिष्टताओं पर निर्भर कर सकता है।
हालाँकि OCR मुद्रित पाठ के लिए मुख्य रूप से डिज़ाइन किया गया है, कुछ उन्नत OCR सिस्टम हस्तलिखित पहचानने में भी सक्षम होते हैं। हालाँकि, आमतौर पर हस्तलिखित पहचाननेवालों की पहचान करने में कम सटीकता होती है क्योंकि व्यक्तिगत लेखन शैलियों में व्यापक भिन्नता होती है।
हाँ, कई OCR सॉफ़्टवेयर सिस्टम एकाधिक भाषाओं को पहचान सकते हैं। हालाँकि, यह महत्वपूर्ण है कि आपके उपयोग में आने वाले सॉफ़्टवेयर द्वारा विशिष्ट भाषा का समर्थन किया जा रहा हो।
OCR ऑप्टिकल कैरेक्टर रिकग्निशन के लिए होता है और यह मुद्रित पाठ को पहचानने के लिए उपयोग होता है, जबकि ICR, या इंटेलिजेंट कैरेक्टर रिकग्निशन, अधिक उन्नत होते हैं और हस्तलिखित पाठ को पहचानने के लिए उपयोग होते हैं।
OCR स्पष्ट, आसानी से पढ़ने वाले फ़ॉन्ट और मानक पाठ आकारों के साथ सबसे अच्छा काम करता है। हालांकि यह विभिन्न फ़ॉन्ट और आकारों के साथ काम कर सकता है, लेकिन असामान्य फ़ॉन्ट्स या बहुत छोटे पाठ आकारों के साथ काम करते समय सटीकता कम होने की प्रवृत्ति होती है।
OCR कम resolution के दस्तावेज़, जटिल fonts, खराब प्रिंट वाले पाठ, हस्तलिखित, और वे दस्तावेज़ जो पाठ के साथ दखल देने वाले पृष्ठभूमियों के साथ संघर्ष कर सकते हैं। साथ ही, जबकि यह कई भाषाओं के साथ काम कर सकता है, यह हर भाषा को पूरी तरह से नहीं कवर कर सकता है।
हाँ, OCR रंगीन पाठ और पृष्ठभूमियों को स्कैन कर सकता है, हालाँकि यह आमतौर पर उच्च-विपरीत रंग संयोजनों, जैसे कि एक सफेद पृष्ठभूमि पर काले पाठ, के साथ अधिक प्रभावी होता है। पाठ और पृष्ठभूमि रंगों में पर्याप्त विपरीतता की कमी होने पर सटीकता कम हो सकती है।
PCL (प्रिंटर कमांड लैंग्वेज) इमेज फॉर्मेट JPEG या PNG जैसे स्टैंडअलोन इमेज फॉर्मेट नहीं है, बल्कि Hewlett-Packard (HP) द्वारा विकसित PCL प्रिंटर लैंग्वेज का एक हिस्सा है। PCL एक पेज डिस्क्रिप्शन लैंग्वेज (PDL) है जिसका उपयोग प्रिंटिंग डिवाइस को नियंत्रित करने के लिए किया जाता है और कई अलग-अलग प्रिंटर मॉडल द्वारा व्यापक रूप से समर्थित है। इसका उपयोग प्रिंटर को यह बताने के लिए किया जाता है कि किसी दस्तावेज़ को कैसे प्रिंट किया जाए, जिसमें टेक्स्ट, फॉन्ट, ग्राफिक्स और इमेज शामिल हैं। PCL लैंग्वेज का उपयोग प्रिंटेड पेज पर टेक्स्ट और ग्राफिक्स के लेआउट का वर्णन करने के लिए किया जाता है, और इसमें प्रिंटर की ग्राफिकल स्थिति को नियंत्रित करने और इमेज को रैस्टराइज करने (पिक्सल में कन्वर्ट करने) के लिए कमांड शामिल हैं।
PCL को पहली बार 1980 के दशक में पेश किया गया था और समय के साथ विकसित हुआ है, जिसमें कई संस्करण जारी किए गए हैं। सबसे आम संस्करण PCL 5, PCL 5e और PCL 6 (जिसे PCL XL के रूप में भी जाना जाता है) हैं। PCL 5 ने मैक्रोज़, बड़े बिटमैप्ड फॉन्ट और ग्राफिक्स क्षमताओं को पेश किया। PCL 5e (एन्हांस्ड) ने प्रिंटर और PC के बीच द्विदिश संचार जोड़ा और प्रिंटिंग गति और इमेज क्वालिटी में सुधार किया। PCL 6, जिसे जटिल ग्राफिक्स के लिए एक कुशल प्रोटोकॉल के रूप में डिज़ाइन किया गया है, डेटा ट्रांसमिट करने के लिए एक संपीड़ित प्रोटोकॉल का उपयोग करता है और विंडोज जैसे ग्राफिकल यूजर इंटरफेस से प्रिंटिंग के लिए अनुकूलित है।
PCL के संदर्भ में, एक इमेज को डॉट्स के एक पैटर्न के रूप में दर्शाया जाता है जिसे कागज पर प्रिंट किया जा सकता है। PCL इमेज को दर्शाने के लिए वेक्टर कमांड और रैस्टर ग्राफिक्स के संयोजन का उपयोग करता है। वेक्टर कमांड का उपयोग आकृतियाँ और रेखाएँ खींचने के लिए किया जाता है, जबकि रैस्टर ग्राफिक्स का उपयोग अधिक जटिल इमेज या तस्वीरों के लिए किया जाता है। जब एक PCL प्रिंटर को कोई दस्तावेज़ प्राप्त होता है, तो वह अंतिम प्रिंटेड आउटपुट बनाने के लिए इन कमांड को प्रोसेस करता है।
PCL में रैस्टर इमेज को कमांड की एक श्रृंखला का उपयोग करके परिभाषित किया जाता है जो इमेज डेटा के रिज़ॉल्यूशन, आकार और एन्कोडिंग को निर्दिष्ट करता है। PCL इमेज का रिज़ॉल्यूशन आमतौर पर डॉट्स प्रति इंच (DPI) में निर्दिष्ट किया जाता है, जो इंगित करता है कि प्रिंटर कागज के एक रैखिक इंच पर इमेज को दर्शाने के लिए कितने डॉट्स का उपयोग करेगा। इमेज का आकार डॉट्स की पंक्तियों और स्तंभों की संख्या के संदर्भ में परिभाषित किया गया है।
PCL रैस्टर इमेज डेटा को एन्कोड करने के लिए कई तरीकों का समर्थन करता है। एक सामान्य तरीका एक साधारण रन-लेंथ एन्कोडिंग (RLE) का उ पयोग करना है, जो एक ही रंग के अनुक्रमों को एक एकल मान और एक गणना के साथ बदलकर इमेज डेटा को संपीड़ित करता है। यह एक ही रंग के बड़े क्षेत्रों वाली इमेज के लिए विशेष रूप से प्रभावी है। PCL अधिक जटिल संपीड़न योजनाओं का भी समर्थन करता है, जैसे डेल्टा रो संपीड़न, जो केवल पिक्सल की आसन्न पंक्तियों के बीच के अंतर को एन्कोड करता है, और अनुकूली संपीड़न, जो इमेज के विभिन्न भागों के लिए विभिन्न संपीड़न विधियों के बीच स्विच कर सकता है।
PCL दस्तावेज़ में एक इमेज को शामिल करने के लिए, इमेज डेटा को पहले PCL फॉर्मेट में कन्वर्ट किया जाना चाहिए। इसमें इमेज को रैस्टराइज करना शामिल है, जिसका अर्थ है इसे उसके मूल फॉर्मेट (जैसे JPEG या PNG) से डॉट्स के ग्रिड में कन्वर्ट करना जिसे प्रिंटर समझ सकता है। रैस्टराइज्ड इमेज को फिर समर्थित संपीड़न विधियों में से एक का उपयोग करके एन्कोड किया जाता है और उपयुक्त PCL कमांड का उप योग करके PCL दस्तावेज़ में एम्बेड किया जाता है।
इमेज को एम्बेड करने के लिए PCL कमांड में 'एंटर रैस्टर मोड' कमांड शामिल है, जो रैस्टर इमेज की शुरुआत का संकेत देता है, और 'रैस्टर डेटा ट्रांसफर' कमांड, जिसका उपयोग प्रिंटर को वास्तविक इमेज डेटा भेजने के लिए किया जाता है। इमेज के रिज़ॉल्यूशन और रंग की गहराई को सेट करने के साथ-साथ पेज पर इमेज को पोजिशन करने के लिए भी कमांड हैं।
PCL इमेज में रंग को रंग पैलेट या डायरेक्ट कलर स्पेसिफिकेशन के उपयोग के माध्यम से नियंत्रित किया जाता है। एक रंग पैलेट में, इमेज में उपयोग किए जाने वाले प्रत्येक रंग को रंग मानों की एक तालिका में एक इंडेक्स द्वारा परिभाषित किया जाता है। प्रिंटर इस तालिका का उपयोग प्रत्येक डॉट के लिए प्रिंट करने के लिए वास्तविक रंग निर्धारित करने के लिए करता है। डायरेक्ट कलर स्पेसिफिकेशन प्रत्येक डॉट के रंग को स्पष्ट रूप से न िर्दिष्ट करने की अनुमति देता है, आमतौर पर लाल, हरे और नीले (RGB) मानों के संयोजन के रूप में।
PCL में हाफ़टोनिंग के लिए भी समर्थन शामिल है, जो डॉट्स के पैटर्न को बदलकर रंग के विभिन्न शेड्स का अनुकरण करने के लिए उपयोग की जाने वाली एक तकनीक है। हाफ़टोनिंग आवश्यक है क्योंकि अधिकांश प्रिंटर में रंगों की एक सीमित संख्या होती है जिन्हें वे प्रिंट कर सकते हैं (अक्सर केवल काला, सियान, मैजेंटा और पीला)। इन मूल रंगों के डॉट्स को सावधानीपूर्वक व्यवस्थित करके, रंगों और रंगों की एक विस्तृत श्रृंखला का अनुकरण किया जा सकता है। PCL इस प्रभाव को प्राप्त करने के लिए कई हाफ़टोनिंग एल्गोरिदम का उपयोग करता है, जिसमें ऑर्डर डाइदरिंग और एरर डिफ्यूजन शामिल हैं।
PCL इमेज वाले दस्तावेज़ को प्रिंट करते समय, कंप्यूटर पर प्रिंटर ड्राइवर दस्तावेज़ को PCL कमांड में कन्वर्ट करता है, जिसमें किसी भी एम्बेडेड इमेज के लिए कमांड शामिल हैं। ड्राइवर किसी भी आवश्यक रंग रूपांतरण को भी संभालता है, जैसे RGB रंगों को प्रिंटर द्वारा उपयोग किए जाने वाले रंग स्थान में परिवर्तित करना (आमतौर पर CMYK - सियान, मैजेंटा, पीला और कुंजी/काला)। परिणामी PCL डेटा स्ट्रीम को फिर प्रिंटिंग के लिए प्रिंटर को भेजा जाता है।
PCL के लाभों में से एक कई अलग-अलग प्रिंटर मॉडल और निर्माताओं में इसका व्यापक समर्थन है। इसका मतलब यह है कि PCL कमांड के साथ फ़ॉर्मेट किए गए दस्तावेज़ों को प्रत्येक प्रिंटर के लिए दोबारा फ़ॉर्मेट किए बिना या समायोजित किए बिना विभिन्न प्रकार के प्रिंटर पर प्रिंट किया जा सकता है। हालाँकि, क्योंकि PCL एक अपेक्षाकृत निम्न-स्तरीय भाषा है, PCL दस्तावेज़ सीधे बनाना जटिल हो सकता है और PCL कमांड सेट की अच्छी समझ की आवश्यकता होती है।
इस कारण से, अधिकांश उपयोगकर्ता कभी भी PCL कमांड के साथ सीधे इंटरैक्ट नहीं करेंगे। इसके बजाय, वे एक प्रिंटर ड्राइवर या एक सॉफ़्टवेयर एप्लिकेशन
यह कन्वर्टर पूरी तरह से आपके ब्राउज़र में चलता है। जब आप एक फ़ाइल का चयन करते हैं, तो यह स्मृति में पढ़ा जाता है और चयनित प्रारूप में रूपांतरित किया जाता है। आप फिर रूपांतरित फ़ाइल डाउनलोड कर सकते हैं।
रूपांतरण तत्काल प्रारंभ होते हैं, और अधिकांश फ़ाइलें एक सेकंड के भीतर रूपांतरित की जाती हैं। बड़ी फ़ाइलें अधिक समय ले सकती हैं।
आपकी फ़ाइलें कभी हमारे सर्वर पर अपलोड नहीं की जाती हैं। वे आपके ब्राउज़र में रूपांतरित होती हैं, और फिर रूपांतरित फ़ाइल डाउनलोड की जाती है। हमें आपकी फ़ाइलें कभी नहीं दिखाई देती हैं।
हम सभी छवि प्रारूपों के बीच रूपांतरण का समर्थन करते हैं, जिसमें JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, और अधिक शामिल हैं।
यह कन्वर्टर पूरी तरह से मुफ्त है, और हमेशा मुफ्त रहेगा। क्योंकि यह आपके ब्राउज़र में चलता है, हमें सर्वर के लिए भुगतान करने की आवश्यकता नहीं होती, इसलिए हमें आपसे शुल्क नहीं लगाना पड़ता।
हाँ! आप एक साथ जितनी चाहें उत्तम फ़ाइलें रूपांतरित कर सकते हैं। बस जब आप उन्हें जोड़ते हैं तो कई फ़ाइलें चुनें।