Che cos'è OCR (riconoscimento ottico del personaggio)?

Il riconoscimento ottico dei caratteri (OCR) è un processo di conversione di materiali stampati in file di testo o elaborazione testi che possono essere facilmente modificati e archiviati. La tecnologia ha consentito di memorizzare tali materiali utilizzando molto meno spazio di archiviazione rispetto ai materiali cartacei. La tecnologia OCR ha avuto un impatto enorme sul modo in cui le informazioni vengono archiviate, condivise e modificate. Prima del riconoscimento ottico dei personaggi, se qualcuno voleva trasformare un libro in un file di elaborazione di testi, ogni pagina dovrebbe essere digitata Word per Word.

La tecnologia OCR richiede sia hardware che software. Inoltre, i sofisticati sistemi OCR richiedono un circuito aggiuntivo nel computer stesso per completare il processo. Uno scanner ottico scansiona il testo su una pagina, quindi rompe i caratteri in una serie di punti chiamati Bitmap. Il software può leggere i caratteri più comuni e distinguere dove le linee iniziano e si fermano. Questa bitmap viene quindi tradotta in testo del computer.

mentre il riconoscimento ottico del personaggio ha reso enormeProgressi negli ultimi anni, non si comporta sempre bene nel riconoscere la scrittura a mano o i caratteri che sembrano simili alla calligrafia. Esistono sistemi nel settore bancario che utilizzano la tecnologia OCR per cercare di leggere gli importi su controlli scritti a mano, per seguire la capacità del computer di leggere i numeri di routing e account.

Per dare un'idea del potere dell'OCR, può aiutare a dare un'occhiata a un esempio del mondo reale. Immagina un dipartimento di polizia che ha archiviato tutti i suoi casellari penali in vasti archivi. Sebbene la scansione di milioni di pagine sarebbe un'impresa costosa e che richiede tempo, i benefici sono enormi.

Una volta che il sistema OCR ha convertito le pagine in testo leggibile dal computer, un detective, ad esempio, potrebbe cercare l'intera storia in pochi secondi. Trovare manualmente un record particolare potrebbe non essere troppo difficile, ma immagina un detective che cerca di bruciareCH Per tutti i crimini commessi in un certo incrocio tra le 8:00 e le 8:30. Questo esempio graffia solo la superficie del potere del testo ricercabile, ed è solo uno dei motivi per cui molte aziende e istituzioni spendono milioni di dollari per OCR i loro dati legacy.

ALTRE LINGUE

Questo articolo è stato utile? Grazie per il feedback Grazie per il feedback

Come possiamo aiutare? Come possiamo aiutare?