OCR หรือ Optical Character Recognition เป็นเทคโนโลยีที่ใช้แปลงชนิดต่าง ๆ ของเอกสาร อาทิ เอกสารที่สแกน ไฟล์ PDF หรือภาพที่ถ่ายด้วยกล้องดิจิตอล เป็นข้อมูลที่สามารถแก้ไขและค้นหาได้
ในขั้นตอนแรกของ OCR ภาพของเอกสารข้อความจะถูกสแกน ซึ่งอาจจะเป็นภาพถ่ายหรือเอกสารที่สแกน จุดประสงค์ของขั้นตอนนี้คือการสร้างสำเนาดิจิตอลของเอกสาร แทนการถอดรหัสด้วยมือ เพิ่มเติม กระบวนการดิจิไทซ์นี้ยังสามารถช่วยเพิ่มอายุยาวนานของวัสดุเนื่อ งจากลดการจับจัดทรัพยากรที่เปราะบาง
เมื่อเอกสารถูกดิจิตอลไปแล้ว ซอฟต์แวร์ OCR จะแยกภาพออกเป็นตัวอักษรแต่ละตัวเพื่อจัดรูป นี้เรียกว่ากระบวนการแบ่งส่วน การแบ่งส่วนจะแยกเอกสารออกเป็นบรรทัด คำ แล้วค่อยแยกเป็นตัวอักษร การแบ่งแยกนี้เป็นกระบวนการที่ซับซ้อนเนื่องจากมีปัจจัยมากมายที่เข้ามาเกี่ยวข้อง -- แบบอักษรที่แตกต่างกัน ขนาดข้อความที่แตกต่างกัน และการจัดเรียงข้อความที่ไม่เหมือนใคร เพียงแค่นี้ยังมีอีก
หลังจากการแบ่งส่วน อัลกอริทึม OCR จะใช้การรู้จำรูปแบบเพื่อระบุตัวอักษรแต่ละตัว สำหรับแต่ละตัวอักษร อัลกอริทึมจะเปรียบเทียบกับฐานข้อมูลของรูปร่างตัวอักษร การจับคู่ที่ใกล้ที่สุดจะถูกเลือกเป็นตัวตนของตัวอักษร ในการรู้จำคุณสมบัติ ซึ่งเป็นรูปแบบอย่างหนึ่งของ OCR ที่ขั้นสูง อัลกอริทึมไม่เพียงแค่ศึกษารูปร่าง แต่ยังสนใจเส้นและเส้นโค้งในรูปแบบด้วย
OCR มีการประยุกต์ใช้ที่มีประโยชน์หลายอย่าง -- จากการดิจิทัลไซส์เอกสารที่พิมพ์ การเปิดใช้บริการอ่านข้อความอัตโนมัติ การปรับเปลี่ยนกระบวนการรับข้อมูลอัตโนมัติ ไปจนถึงการช่วยผู้ใช้ที่มีความบกพร่องทางการมองเห็นในการมีปฏิสัมพันธ์กับข้อความอย่างมากยิ่งขึ้น แต่ก็ควรทราบว่ากระบวนการ OCR ไม่ได้เป็นที่ถาวรและอาจทำความผิดพลาดได้โดยเฉพาะอย่างยิ่งเมื่อมีการจัดการเอกสารความละเอียดต่ำ แบบอักษรซับซ้อน หรือข้อความที่พิมพ์ไม่ดี ดังนั้น ความแม่นยำของระบบ OCR มีความแตกต่างกันอย่างมากขึ้นอยู่กับคุณภาพของเอกสารต้นฉบับและซอฟต์แวร์ OCR ที่ใช้เฉพาะสำคัญ
OCR เป็นเทคโนโลยีสำคัญในการฝึกฝนและการดิจิตอลในปัจจุบัน มันช่วยประหยัดเวลาและทรัพยากรอย่างมากโดยลดต้องการการป้อนข้อมูลด้วยมือและให้ทางเลือกที่น่าเชื่อถือ มีประสิทธิภาพในการแปลงเอกสารทางกายภาพเป็นรูปแบบดิจิตอล.
Optical Character Recognition (OCR) เป็นเทคโนโลยีที่ใช้ในการแปลงประเภทต่าง ๆ ของเอกสาร เช่น ผลงานที่สแกนด้วยกระดาษ PDF ไฟล์หรือภาพที่ถ่ายด้วยกล้องดิจิตอล ให้เป็นข้อมูลที่สามารถแก้ไขและค้นหาได้
OCR ทำงานโดยการสแกนภาพนำเข้าต่างๆหรือเอกสาร การแบ่งภาพออกเป็นตัวอักษรแต่ละตัว แล้วเปรียบเทียบแต่ละตัวอักษรกับฐานข้อมูลแบบรูปของตัวอักษรโดยใช้การจดจำรูปแบบหรือจดจำลักษณะ
OCR ถูกนำไปใช้ในหลายภาคและการประยุกต์ใช้ เช่น การเปลี่ยนเอกสา รที่พิมพ์ออกมาเป็นดิจิตอล การเปิดให้บริการอักษรเป็นเสียง การทำให้กระบวนการกรอกข้อมูลเป็นอัตโนมัติ และสนับสนุนผู้ที่มีความบกพร่องทางการมองเห็นให้สามารถสัมผัสปฏิสัมพันธ์กับข้อความได้ตรงตามความต้องการ
อย่างไรก็ตาม ทั้งที่เทคโนโลยี OCR ได้พัฒนามาอย่างมาก แต่ยังไม่มีความสมบูรณ์ การมีความแม่นยำมักจะขึ้นอยู่กับคุณภาพของเอกสารเดิมและรายละเอียดของซอฟต์แวร์ OCR ที่ใช้
ถึงแม้ว่า OCR ถูกออกแบบมาสำหรับข้อความที่พิมพ์ แต่ระบบ OCR ที่ระดับสูงบางระบบสามารถจดจำลายมือที่ชัดเจน สอดคล้องได้ อย่างไรก็ดี ทั่วไปแล้วการจดจำลายมือมีความแม่นยำน้อยกว่า เนื่องจากมีการผันแปรของรูปแบบการเขียนของแต่ละคน
ใช่ ซอฟต์แวร์ OCR หลายระบบสามารถจดจำภาษาหลายภาษา อย่างไรก็ตาม สำคัญที่จะต้องดูว่าภาษาที่ต้องการได้รับการสนับสนุนโดยซอฟต์แวร์ที่คุณใช้
OCR ย่อมาจาก Optical Character Recognition และใช้ในการจดจำข้อความที่พิมพ์ขณะที่ ICR หรือ Intelligent Character Recognition ที่ทันสมัยยิ่งขึ้นและใช้สำหรับการจดจำข้อความที่เขียนด้วยมือ
OCR ทำงานได้ดีที่สุดกับแบบอักษรที่ชัดเจน, สามารถอ่านได้ง่ายและมีขนาดข้อความมาตรฐาน ในขณะที่มันสามารถทำงานได้กับแบบอักษรและขนาดที่หลากหลาย แต่ความถูกต้องมักจะลดลงเมื่อจัดการกับแบบอักษรที่ไม่ปกติหรือขนาดข้อความที่เล็กมาก
OCR อาจพบปัญหากับเอกสารที่มีความละเอียดต่ำ, แบบอักษรซับซ้อน, ข้อความที่พิมพ์ไม่ดี, ลายมือ และเอกสารที่มีพื้นหลังที่แทรกซ้อนกับข้อความ นอกจากนี้ อย่างไรก็ตาม อาจใช้งานกับภาษาหลายภาษาได้ มันอาจไม่ครอบคลุมทุกภาษาอย่างสมบูรณ์
ใช่ OCR สามารถสแกนข้อความที่มีสีและพื้นหลังที่มีสี แม้ว่าจะมีประสิทธิภาพมากขึ้นด้วยสีที่มีความเปรียบเทียบความตัดกัน เช่น ข้อความดำบนพื้นหลังสีขาว ความถูกต้องอาจลดลงเมื่อสีข้อความและสีพื้นหลังไม่มีความคมชัดเพียงพอ
Portable Document Format (PDF) เป็นรูปแบบไฟล์ที่หลากหลายท ี่พัฒนาโดย Adobe Systems ในปี 1993 ออกแบบมาเพื่อนำเสนอเอกสาร รวมถึงการจัดรูปแบบข้อความและรูปภาพในลักษณะที่ไม่ขึ้นกับซอฟต์แวร์แอปพลิเคชัน ฮาร์ดแวร์ และระบบปฏิบัติการ PDF สามารถรวมเนื้อหาที่หลากหลายไว้ด้วยกัน รวมถึงข้อความ ฟอนต์ กราฟิกแบบเวกเตอร์ รูปภาพแรสเตอร์ และข้อมูลอื่นๆ ที่จำเป็นในการแสดงเอกสารตามที่ตั้งใจไว้ รูปแบบนี้ได้กลายเป็นมาตรฐานสำหรับการแลกเปลี่ยนเอกสารในแพลตฟอร์มต่างๆ และใช้กันอย่างแพร่หลายในธุรกิจ การศึกษา และรัฐบาล
PDF รองรับรูปภาพหลายประเภท ซึ่งสามารถแบ่งออกเป็นสองกลุ่มได้โดยทั่วไป ได้แก่ รูปภาพแบบเวกเตอร์และรูปภาพแรสเตอร์ รูปภาพแบบเวกเตอร์ประกอบด้วยเส้นทางที่กำหนดโดยสมการทางคณิตศาสตร์ ซึ่งทำให้สามารถปรับขนาดได้โดยไม่สูญเสียคุณภาพ เหมาะสำหรับภาพประกอบ โลโก้ และข้อความ ในทางกลับกัน รูปภาพแรสเ ตอร์ประกอบด้วยตารางพิกเซลคงที่และใช้สำหรับภาพถ่ายและงานศิลปะดิจิทัล รูปภาพเหล่านี้อาจสูญเสียคุณภาพเมื่อขยายหรือลดขนาด PDF สามารถมีรูปภาพทั้งสองประเภท และสามารถบีบอัดได้โดยใช้อัลกอริทึมต่างๆ เพื่อลดขนาดไฟล์โดยไม่ลดทอนคุณภาพอย่างมีนัยสำคัญ
เมื่อฝังรูปภาพใน PDF รูปภาพนั้นมักจะถูกบีบอัดเพื่อลดขนาดไฟล์ PDF รองรับอัลกอริทึมการบีบอัดหลายแบบเพื่อวัตถุประสงค์นี้ สำหรับรูปภาพแรสเตอร์ มักใช้การบีบอัดแบบสูญเสียข้อมูล เช่น JPEG สำหรับภาพถ่าย เนื่องจากสามารถลดขนาดไฟล์ได้อย่างมากโดยสูญเสียคุณภาพที่มองเห็นได้เพียงเล็กน้อย ใช้การบีบอัดแบบไม่สูญเสียข้อมูล เช่น PNG และ TIFF เมื่อคุณภาพของรูปภาพมีความสำคัญสูงสุด สำหรับรูปภาพแบบเวกเตอร์ การบีบอัดทำได้โดยใช้การแสดงทางคณิตศาสตร์ที่มีประสิทธิภาพของเส้นทางรูปภาพ และสามารถใช้ก ารบีบอัดอัลกอริทึม เช่น ZIP เพื่อลดขนาดของการแสดงเหล่านี้
กระบวนการฝังรูปภาพใน PDF เกี่ยวข้องกับหลายขั้นตอน ขั้นแรก รูปภาพจะถูกเข้ารหัสโดยใช้อัลกอริทึมการบีบอัดเฉพาะ จากนั้นข้อมูลรูปภาพที่เข้ารหัสจะถูกฝังไว้ในโครงสร้างไฟล์ PDF พร้อมกับข้อมูลเกี่ยวกับขนาด ความละเอียด และพื้นที่สีของรูปภาพ PDF ยังจัดเก็บข้อมูลเกี่ยวกับวิธีที่ควรแสดงรูปภาพ รวมถึงการแปลงใดๆ เช่น การปรับขนาด การหมุน หรือการครอบตัดที่ควรใช้เมื่อดูหรือพิมพ์เอกสาร
การจัดการสีเป็นแง่มุมที่สำคัญของรูปภาพ PDF PDF รองรับพื้นที่สีต่างๆ เช่น DeviceRGB, DeviceCMYK และ DeviceGray รวมถึงพื้นที่สีที่ซับซ้อนกว่า เช่น CalRGB และพื้นที่สีที่ใช้ ICC ซึ่งช่วยให้การสร้างสีที่แม่นยำยิ่งขึ้นในอุปกรณ์ต่างๆ เมื่อฝังรูปภาพใน PDF พื้นที่สีจะถูกกำหนด และหากจำเป็น โปรไฟล์สีสามารถฝังไว้เพื่อให้แน่ใจว่ าสีจะแสดงอย่างสม่ำเสมอในอุปกรณ์ต่างๆ
ความโปร่งใสเป็นอีกหนึ่งคุณสมบัติที่รองรับโดยรูปภาพ PDF คุณสมบัตินี้ช่วยให้รูปภาพมีความทึบแสงในระดับต่างๆ ซึ่งสามารถใช้เพื่อสร้างเอฟเฟกต์ภาพที่ซับซ้อน ความโปร่งใสใน PDF จะจัดการโดยใช้โหมดการผสมผสานพิเศษที่กำหนดวิธีผสมสีของวัตถุโปร่งใสกับสีของวัตถุที่อยู่ด้านหลัง คุณสมบัตินี้มีประโยชน์อย่างยิ่งสำหรับการซ้อนภาพทับกันหรือสำหรับการรวมข้อความที่ซ้อนทับรูปภาพ
PDF ยังรองรับการรวมเมตาดาต้าไว้ในไฟล์รูปภาพ เมตาดาต้านี้อาจรวมถึงข้อมูลเกี่ยวกับรูปภาพ เช่น ผู้แต่ง ลิขสิทธิ์ วันที่สร้าง และคำหลัก ข้อมูลนี้อาจมีประโยชน์สำหรับการจัดการและการเรียกคืนเอกสาร รวมถึงเพื่อให้แน่ใจว่ามีการให้เครดิตที่เหมาะสมสำหรับการใช้รูปภาพที่มีลิขสิทธิ์ เมตาดาต้าจะถูกจัดเก็บในรูปแบบมาตรฐาน ภายใน PDF ทำให้เข้าถึงและอ่านได้ง่ายโดยแอปพลิเคชันซอฟต์แวร์ต่างๆ
ความปลอดภัยเป็นคุณสมบัติหลักของรูปแบบ PDF และขยายไปถึงรูปภาพในเอกสาร PDF PDF สามารถเข้ารหัสได้ และสามารถควบคุมการเข้าถึงได้โดยใช้รหัสผ่าน ซึ่งหมายความว่ารูปภาพที่ละเอียดอ่อนที่ฝังอยู่ใน PDF สามารถป้องกันการเข้าถึงโดยไม่ได้รับอนุญาต นอกจากนี้ PDF ยังรองรับลายเซ็นดิจิทัล ซึ่งสามารถใช้เพื่อตรวจสอบความถูกต้องและความสมบูรณ์ของเอกสาร รวมถึงรูปภาพใดๆ ที่มีอยู่
รูปแบบ PDF ยังออกแบบมาเพื่อการเข้าถึง ซึ่งหมายความว่ารองรับคุณสมบัติที่ทำให้ผู้พิการสามารถใช้เอกสารได้ สำหรับรูปภาพ คุณสมบัตินี้รวมถึงความสามารถในการรวมคำอธิบายข้อความทางเลือกที่โปรแกรมอ่านหน้าจอสามารถอ่านได้ ซึ่งช่วยให้มั่นใจได้ว่าข้อมูลที่ถ่ายทอดโดยรูปภาพสามารถเข้าถึงได้โดยผู้ใช้ที่มีค วามบกพร่องทางสายตา
เมื่อพูดถึงการพิมพ์ PDF มีความน่าเชื่อถือสูงเนื่องจากมีลักษณะที่เป็นอิสระ ข้อมูลที่จำเป็นทั้งหมดเพื่อสร้างเอกสารขึ้นมาใหม่ได้อย่างแม่นยำ รวมถึงรูปภาพ จะถูกฝังไว้ในไฟล์ ซึ่งหมายความว่า PDF จะพิมพ์ในลักษณะเดียวกันบนเครื่องพิมพ์ใดก็ได้ โดยไม่คำนึงถึงอุปกรณ์หรือซอฟต์แวร์ที่ใช้ คุณสมบัตินี้มีความสำคัญอย่างยิ่งสำหรับเอกสารที่ต้องการเค้าโครงที่แม่นยำและรูปภาพคุณภาพสูง เช่น โบรชัวร์และนิตยสาร
ไฟล์ PDF สามารถโต้ตอบได้ และขยายไปถึงรูปภาพด้วย รูปภาพใน PDF สามารถเป็นไฮเปอร์ลิงก์ได้ ซึ่งหมายความว่าการคลิกที่รูปภาพจะนำผู้ใช้ไปยังส่วนอื่นของเอกสารหรือแม้แต่ไปยังเว็บไซต์ภายนอก นอกจากนี้ PDF ยังสามารถรวมฟิลด์ฟอร์ม คำอธิบายประกอบ และองค์ประกอบแบบโต้ตอบอื่นๆ ที่สามารถเชื่อมโยงกับรูปภาพได้ ซึ่งช่วยเ พิ่มประสบการณ์ของผู้ใช้และฟังก์ชันการทำงานของเอกสาร
การสร้างและจัดการ PDF รวมถึงการฝังและการแก้ไขรูปภาพ สามารถทำได้โดยใช้เครื่องมือซอฟต์แวร์ต่างๆ Adobe Acrobat เป็นโปรแกรมแก้ไข PDF ที่เป็นที่รู้จักมากที่สุด แต่มีเครื่องมืออื่นๆ อีกมากมายให้เลือก รวมถึงตัวเลือกฟรีและโอเพนซอร์ส เครื่องมือเหล่านี้ช่วยให้ผู้ใช้สามารถแทรกภาพลงใน PDF ปรับขนาดและครอบตัด ปรับคุณสมบัติ และทำงานแก้ไขอื่นๆ ซอฟต์แวร์แก้ไข PDF ขั้นสูงยังสามารถทำการจดจำอักขระด้วยแสง (OCR) บนรูปภาพได้ โดยแปลงข้อความในรูปภาพให้เป็นข้อความที่ค้นหาและแก้ไขได้
ในแง่ของโครงสร้างไฟล์ เอกสาร PDF ประกอบด้วยวัตถุที่กำหนดเนื้อหาของเอกสาร วัตถุเหล่านี้จัดเป็นโครงสร้างลำดับชั้นที่เรียกว่า 'แผนผังวัตถุ' ของเอกสาร รูปภาพจะถูกฝังไว้ในโครงสร้างนี้เป็น 'วัตถุรูปภาพ' วัตถุรูปภาพแต่ละชิ้นมีสตรีมข้อมูลรูปภาพที่บีบอัด รวมถึงพจนานุกรมที่กำหนดคุณสมบัติของรูปภาพ เช่น ประเภท ความกว้าง ความสูง พื้นที่สี และตัวกรองใดๆ ที่ใช้สำหรับการบีบอัด
ข้อกำหนด PDF ได้พัฒนาไปตามกาลเวลาและปัจจุบันได้รับการดูแลโดยองค์การระหว่างประเทศว่าด้วยการมาตรฐาน (ISO) ในชื่อ ISO 32000 การทำให้เป็นมาตรฐานนี้ช่วยให้ PDF ยังคงเป็นรูปแบบเปิด และเอกสารที่สร้างขึ้นโดยใช้ซอฟต์แวร์และแพลตฟอร์มต่างๆ สามารถแลกเปลี่ยนและดูได้อย่างน่าเชื่อถือ ข้อกำหนดนี้มีข้อมูลโดยละเอียดเกี่ยวกับวิธีจัดรูปแบบและฝังรูปภาพในไฟล์ PDF เพื่อให้แน่ใจว่ามีความสอดคล้องกันในซอฟต์แวร์ที่หลากหลายที่สามารถสร้างและอ่านเอกสาร PDF ได้
สรุปแล้ว รูปแบบรูปภาพ PDF เป็นส่วนประกอบที่ซับซ้อนและมีคุณสมบัติมากมายของมาตรฐาน PDF รองรับประเภทรูปภาพและอัลกอริทึมการ
ตัวแปลงนี้ทำงานทั้งหมดในเบราว์เซอร์ของคุณ เมื่อคุณเลือก ไฟล์ มันจะถูกอ่านเข้าสู่หน่ว ยความจำและแปลงเป็นรูปแบบที่เลือก คุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้.
การแปลงเริ่มทันที และไฟล์ส่วนใหญ่ถูกแปลงใน ภายใต้วินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานขึ้น.
ไฟล์ของคุณไม่เคยถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา พวกเขา ถูกแปลงในเบราว์เซอร์ของคุณ และไฟล์ที่แปลงแล้วจากนั้น ดาวน์โหลด เราไม่เคยเห็นไฟล์ของคุณ.
เราสนับสนุนการแปลงระหว่างทุกรูปแบบภาพ รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF, และอื่น ๆ อีกมากมาย.
ตัวแปลงนี้เป็นฟรีและจะเป็นฟรีตลอดไป เนื่องจากมันทำงานในเบราว์เซอร์ของคุณ เราไม่ต้องจ่ายเงินสำหรับ เซิร์ฟเวอร์ ดังนั้นเราไม่จำเป็นต้องเรียกเก็บค่าใช้จ่ายจากคุณ.
ใช่! คุณสามารถแปลงไฟล์เท่าที่คุณต้องการในครั้งเดียว แค่ เลือกไฟล์หลายไฟล์เมื่อคุณเพิ่มพวกเขา.