OCR yazılımı veya optik karakter tanıma yazılımı, metin görüntülerini bir bilgisayarın okuyabileceği gerçek metne dönüştürmek için tasarlanmış bir yazılımdır. Genel olarak, bir görüntü bir bilgisayara tarandıktan sonra OCR yazılımı kullanılır, ancak diğer girdi türleri de kullanılabilir. OCR yazılımı, önceden yazdırılmış bir metinde, orijinal bir çıktının kaybolduğu durumlarda veya daktiloda yazılmış sayfalarda tarama yaparken en iyi şekilde çalışır. Bununla birlikte, iyi bir yazılım el yazısı metnini de çevirebilir, ancak bu tür bir dönüşümdeki hata oranı çok daha yüksek olma eğilimindedir.
Gerçek OCR yazılımı terimi, çoğu modern OCR yazılımının aslında optik karakter tanıma özelliğini kullanmadığı, ancak gerçekte dijital karakter tanıma özelliğini kullandığı için biraz yanıltıcıdır. Bunun nedeni, birkaç yıl önce alanların etkin bir şekilde birleşmesi ve her iki alanın da daha cazip optik karakter tanıma terimini kullanmasıdır. OCR yazılımı son yıllarda büyük ölçüde gelişmiş, modern programlar, metin tanımlamadaki öncekilerden çok daha iyi.
Aslında, erken OCR yazılımı, programın doğru bir şekilde girilmeden önce belirli bir yazı tipi üzerinde eğitimi almasını gerektiriyordu. Benzer şekilde, el yazısı girildiğinde, programın eğitilmesi gerekecekti, inanılmaz derecede zaman alan bir süreç. Bununla birlikte, yöntemler gelişti ve artık daha akıllı sistemler artık norm. Kullanılan yöntemler şimdi nispeten statiktir, sadece biraz araştırma tamamen yeni yöntemler geliştirmeye ve çoğu araştırma onları daha doğru hale getirmek için rafine etmeye devam eder. İlk OCR yazılımı, 1950'lerde kredi kartı iznini okumak için kullanan büyük şirketler ve 1960'ların ortasından bu yana postaları sıralamak için kullanan ABD Posta Servisi gibi geniş bir uygulama yelpazesinde kullanıldı.
On yıl önce, birçok program belirli görevlerde oldukça kötüydü ve diğerlerinde makul derecede iyi olduğu için bir OCR yazılımı parçası seçmek zordu. Ancak bu günlerde, alan büyük ölçüde seviyelendi. Herhangi bir iyi OCR yazılımında, yazılan Latince komut dosyalarını çevirmek için doğruluk oranları% 99'un üzerindedir. Bununla birlikte, el yazısı, veya daha karmaşık yazı tiplerini girmek söz konusu olduğunda, OCR yazılımı hala nispeten yüksek bir aralığa sahiptir.
OCR yazılımının maliyeti de, genellikle sahip olduğu doğruluk oranlarıyla ilişkili olarak, geniş ölçüde dalgalanmaktadır. Basılı maddelerin girilmesi için uygun olan adil bir miktarda ücretsiz OCR yazılımı bulunabilir ve bazıları, özellikle de bazı eğitimlerde el yazısını tespit etmede nispeten iyi olan bir kısmı bulunabilir. Ev sürümü için yaklaşık 100 ABD Doları (ABD Doları) ve profesyonel sürüm için yaklaşık 450 ABD doları olan OmniPage paketi gibi daha pahalı yazılım paketleri, etkileyici özellik dizileri ve genellikle daha yüksek başarı oranları sunar.
Ne yazık ki, hala mükemmel OCR yazılımı diye bir şey yoktur, bu yüzden satın almak için bir program seçmek hala büyük ölçüde sinir bozucu bir süreç olabilir. En iyi programlar bile el yazısı ile zor zamanlar yaşayacak ve hatalar kaçınılmaz olarak bile olsa düşük seviyelerde sürünecek. Çoğunlukla, satın almak için bir program seçmek, ek özelliklere sahiptir: çok dilli destek, tek dokunuşla tarama ve dönüşüm entegrasyonu, otomatik PDF dönüşümü ve yasal ve tıbbi alanlar gibi özel disiplinlerde tam sözcük tanıma.


