ซอฟต์แวร์ OCR หรือซอฟต์แวร์การรู้จำอักขระด้วยแสงเป็นซอฟต์แวร์ที่ออกแบบมาเพื่อแปลรูปภาพของข้อความเป็นข้อความจริงที่คอมพิวเตอร์สามารถอ่านได้ โดยทั่วไปแล้วซอฟต์แวร์ OCR จะใช้หลังจากสแกนภาพไปยังคอมพิวเตอร์แล้วแม้ว่าอาจใช้รูปแบบการป้อนข้อมูลอื่น ซอฟต์แวร์ OCR ทำงานได้ดีที่สุดกับข้อความที่พิมพ์ไปแล้วทั้งในกรณีที่งานพิมพ์ต้นฉบับสูญหายหรือในแผ่นงานสแกนที่พิมพ์บนเครื่องพิมพ์ดีด ซอฟต์แวร์ที่ดีอาจสามารถแปลข้อความที่เขียนด้วยลายมือได้แม้ว่าอัตราข้อผิดพลาดในการแปลงประเภทนี้มีแนวโน้มสูงกว่ามาก
ซอฟต์แวร์ OCR ระยะจริงเป็นความเข้าใจผิดเล็กน้อยเนื่องจากซอฟต์แวร์ OCR ที่ทันสมัยส่วนใหญ่ไม่ได้ใช้การรู้จำตัวอักษรแบบออปติคัล แต่จริง ๆ แล้วใช้การรู้จำตัวอักษรแบบดิจิทัล นี่เป็นเพราะเมื่อหลายปีก่อนเขตข้อมูลถูกรวมอย่างมีประสิทธิภาพและฟิลด์ทั้งสองได้นำการรู้จำอักขระด้วยแสงที่น่าสนใจยิ่งขึ้นมาใช้ ซอฟต์แวร์ OCR มีความก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมาโดยมีโปรแกรมที่ทันสมัยดีกว่ารุ่นก่อน ๆ อย่างมากในการระบุข้อความ
ในความเป็นจริงแล้วซอฟต์แวร์ OCR รุ่นแรกจำเป็นต้องมีการฝึกอบรมโปรแกรมในแบบอักษรเฉพาะก่อนที่จะสามารถป้อนข้อมูลได้อย่างถูกต้อง ในทำนองเดียวกันเมื่อป้อนข้อมูลด้วยลายมือโปรแกรมจะต้องผ่านการฝึกอบรมกระบวนการที่อาจใช้เวลานานอย่างไม่น่าเชื่อ อย่างไรก็ตามวิธีการต่าง ๆ ได้รับการปรับปรุงให้ดีขึ้นและระบบที่ชาญฉลาดมากขึ้นก็กลายเป็นบรรทัดฐาน วิธีการที่ใช้อยู่ในขณะนี้ค่อนข้างคงที่โดยมีการวิจัยเพียงเล็กน้อยเพื่อพัฒนาวิธีการใหม่ทั้งหมดและการวิจัยส่วนใหญ่จะปรับกระบวนการที่มีอยู่เพื่อให้แม่นยำยิ่งขึ้น มีการใช้ซอฟต์แวร์ OCR ยุคแรกในแอปพลิเคชันที่หลากหลายโดยมี บริษัท ใหญ่ ๆ ใช้อ่านบัตรเครดิตในปี 1950 และบริการไปรษณีย์ของสหรัฐอเมริกาใช้เพื่อเรียงลำดับจดหมายตั้งแต่กลางทศวรรษ 1960
สิบปีที่ผ่านมาการเลือกซอฟต์แวร์ OCR เป็นเรื่องยากเนื่องจากหลาย ๆ โปรแกรมมีงานที่ค่อนข้างแย่ในบางงาน อย่างไรก็ตามในวันนี้สนามได้รับการปรับระดับส่วนใหญ่ อัตราความแม่นยำในซอฟต์แวร์ OCR ที่ดีสำหรับการแปลสคริปต์ละตินที่พิมพ์ไว้สูงกว่า 99% เมื่อพูดถึงการป้อนข้อมูลด้วยลายมือ แต่อย่างใดอย่างหนึ่งหรือมากกว่าแบบอักษรที่ซับซ้อนซอฟต์แวร์ OCR ยังคงมีช่วงที่ค่อนข้างสูง
ค่าใช้จ่ายของซอฟต์แวร์ OCR นั้นผันผวนอย่างมากซึ่งมักสัมพันธ์กับอัตราความแม่นยำที่มีอยู่ สามารถพบซอฟต์แวร์ OCR ฟรีจำนวนมากซึ่งเหมาะสำหรับการป้อนข้อมูลสิ่งพิมพ์และบางชนิดสามารถพบได้ซึ่งค่อนข้างดีในการตรวจจับลายมือโดยเฉพาะอย่างยิ่งการฝึกอบรมบางอย่าง ชุดซอฟต์แวร์ราคาแพงกว่าเช่นชุด OmniPage ซึ่งมีราคาประมาณ $ 100 เหรียญสหรัฐ (USD) สำหรับรุ่นที่บ้านและประมาณ $ 450 USD สำหรับรุ่นมืออาชีพโม้คุณสมบัติที่น่าประทับใจและอัตราความสำเร็จที่สูงขึ้นโดยทั่วไป
น่าเสียดายที่ยังไม่มีสิ่งใดที่เป็นซอฟต์แวร์ OCR ที่สมบูรณ์แบบดังนั้นการเลือกโปรแกรมที่จะซื้ออาจเป็นเรื่องที่น่าผิดหวัง แม้แต่โปรแกรมที่ดีที่สุดก็อาจมีช่วงเวลาที่ยากลำบากในการเขียนด้วยลายมือและข้อผิดพลาดก็จะคืบคลานไปอย่างหลีกเลี่ยงไม่ได้แม้ในระดับต่ำ ส่วนใหญ่การเลือกโปรแกรมที่จะซื้อนั้นมาพร้อมกับคุณสมบัติพิเศษ: การสนับสนุนหลายภาษา, การสแกนแบบ one-touch และการรวมการแปลง, การแปลง PDF อัตโนมัติและการรู้จำทั้งคำในสาขาวิชาเฉพาะเช่นสาขากฎหมายและการแพทย์


