การรู้จำอักขระด้วยแสง (OCR) เป็นกระบวนการแปลงสื่อสิ่งพิมพ์เป็นไฟล์ข้อความหรือโปรแกรมประมวลผลคำที่สามารถแก้ไขและจัดเก็บได้อย่างง่ายดาย เทคโนโลยีนี้ทำให้วัสดุดังกล่าวถูกจัดเก็บโดยใช้พื้นที่จัดเก็บน้อยกว่าวัสดุสำเนา เทคโนโลยี OCR ส่งผลกระทบอย่างใหญ่หลวงต่อวิธีการจัดเก็บแบ่งปันและแก้ไขข้อมูล ก่อนการรู้จำอักขระด้วยแสงถ้ามีคนต้องการเปลี่ยนหนังสือเป็นไฟล์ประมวลผลคำแต่ละหน้าจะต้องพิมพ์คำสำหรับคำ
เทคโนโลยี OCR ต้องการทั้งฮาร์ดแวร์และซอฟต์แวร์ นอกจากนี้ระบบ OCR ที่ซับซ้อนยังต้องการแผงวงจรเพิ่มเติมในคอมพิวเตอร์เพื่อให้กระบวนการเสร็จสมบูรณ์ เครื่องสแกนแบบออพติคอลสแกนข้อความบนหน้าจากนั้นแบ่งฟอนต์ลงในชุดของจุดที่เรียกว่าบิตแมป ซอฟต์แวร์สามารถอ่านแบบอักษรที่ใช้กันมากที่สุดและแยกแยะจุดที่เส้นเริ่มต้นและหยุด บิตแมปนี้จะถูกแปลเป็นข้อความคอมพิวเตอร์
ในขณะที่การรู้จำอักขระด้วยแสงมีความก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา แต่ก็ยังทำงานได้ไม่ดีนักในการรู้จำลายมือหรือแบบอักษรที่มีลักษณะคล้ายกับลายมือ มีระบบภายในอุตสาหกรรมการธนาคารที่ใช้เทคโนโลยี OCR เพื่ออ่านจำนวนเช็คที่เขียนด้วยมือเพื่อให้สอดคล้องกับความสามารถของคอมพิวเตอร์ในการอ่านเส้นทางและหมายเลขบัญชี
เพื่อให้ความคิดเกี่ยวกับพลังของ OCR มันสามารถช่วยในการดูตัวอย่างในโลกแห่งความจริง ลองนึกภาพกรมตำรวจที่มีบันทึกความผิดทางอาญาทั้งหมดที่เก็บไว้ในตู้เก็บเอกสารขนาดใหญ่ แม้ว่าการสแกนหลายล้านหน้าจะเป็นงานที่มีราคาแพงและใช้เวลานาน แต่ข้อดีก็คือ
เมื่อระบบ OCR แปลงหน้าเป็นข้อความที่คอมพิวเตอร์อ่านได้นักสืบสามารถค้นหาประวัติทั้งหมดในไม่กี่วินาที การค้นหาระเบียนด้วยตนเองอาจไม่ใช่เรื่องยากเกินไป แต่ลองนึกภาพนักสืบที่พยายามค้นหาอาชญากรรมทั้งหมดที่เกิดขึ้นในจุดตัดระหว่าง 8:00 ถึง 8:30 น. ตัวอย่างนี้เพียงขีดข่วนพื้นผิวของพลังของข้อความที่ค้นหาได้และเป็นเพียงเหตุผลเดียวที่ บริษัท และสถาบันหลายแห่งใช้จ่ายเงินหลายล้านดอลลาร์ไปยัง OCR ข้อมูลดั้งเดิมของพวกเขา


