OCR (Optik Karakter Tanıma) Nedir?

Optik Karakter Tanıma (OCR), basılı materyalleri kolayca düzenlenebilen ve saklanabilen metin veya kelime işlem dosyalarına dönüştürme işlemidir. Teknoloji, bu tür malzemelerin basılı kopya malzemelerden çok daha az depolama alanı kullanarak depolanmasını sağlamıştır. OCR teknolojisi, bilgilerin depolanma, paylaşma ve düzenleme yöntemleri üzerinde büyük bir etki yarattı. Optik karakter tanımadan önce, eğer biri bir kitabı bir kelime işlem dosyasına çevirmek isterse, her sayfa bir kelime için yazılmalıdır.

OCR teknolojisi hem donanım hem de yazılım gerektirir. Ek olarak, karmaşık OCR sistemleri, işlemi tamamlamak için bilgisayarın kendisinde ek bir devre kartı gerektirir. Optik tarayıcı, sayfadaki metni tarar, sonra fontları bitmap adı verilen bir dizi noktaya böler. Yazılım en yaygın yazı tiplerini okuyabilir ve satırların nerede başladığını ve nerede durduğunu ayırt edebilir. Bu bitmap daha sonra bilgisayar metnine çevrilir.

Optik karakter tanıma son yıllarda büyük ilerlemeler kaydetmiş olsa da, el yazısı veya el yazısı ile benzer görünen yazı tiplerini tanımada her zaman iyi performans göstermiyor. Bankacılık endüstrisinde, OCR teknolojisini, elle yazılmış çeklerin tutarlarını okumayı denemek, bilgisayarın yönlendirme ve hesap numaralarını okuyabilmesiyle birlikte kullanan sistemler vardır.

OCR'ın gücü hakkında bir fikir vermek için, gerçek dünyadaki bir örneğe bir göz atmaya yardımcı olabilir. Bütün suç kayıtlarının engin dosya dolaplarında saklandığı bir polis departmanı düşünün. Milyonlarca sayfayı taramak pahalı ve zaman alan bir girişim olsa da, faydaları çok büyük.

OCR sistemi sayfaları bilgisayar tarafından okunabilen bir metne dönüştürdüğünde, örneğin bir dedektif tarihin tamamını birkaç saniye içinde arayabilir. Belirli bir kaydı manuel olarak bulmak çok zor olmayabilir, ancak 8: 00-8: 30 arasında belirli bir kavşakta işlenen tüm suçları aramaya çalışan bir dedektif hayal edin. Bu örnek yalnızca aranabilir metnin gücünün yüzeyini çizer ve çoğu şirket ve kurumun eski verilerini OCR'a milyonlarca dolar harcamasının tek nedeni budur.