Come faccio a scegliere il miglior software OCR?
Il software OCR, o software di riconoscimento ottico dei caratteri, è un software progettato per tradurre immagini di testo in testo reale che un computer può leggere. Generalmente, il software OCR viene utilizzato dopo che un'immagine è stata scansionata su un computer, sebbene possano essere utilizzate anche altre forme di input. Il software OCR funziona meglio sul testo che è già stato digitato, sia nei casi in cui è stata persa una stampa originale, sia nei fogli di scansione digitati su una macchina da scrivere. Un buon software può anche essere in grado di tradurre testi scritti a mano, anche se il tasso di errore su questo tipo di conversione tende ad essere molto più elevato.
Il termine attuale software OCR è un po 'fuorviante, poiché la maggior parte dei software OCR moderni in realtà non utilizza il riconoscimento ottico dei caratteri, ma attualmente utilizza il riconoscimento digitale dei caratteri. Questo perché alcuni anni fa i campi si sono effettivamente uniti, ed entrambi i campi hanno adottato il termine più attraente di riconoscimento ottico dei caratteri. Il software OCR è molto migliorato negli ultimi anni, con programmi moderni sostanzialmente migliori rispetto ai loro predecessori nell'identificazione del testo.
In effetti, i primi software OCR richiedevano di addestrare il programma su un font specifico prima che potesse essere inserito con precisione. Allo stesso modo, quando si introduce la scrittura a mano, il programma dovrebbe essere addestrato, un processo che potrebbe richiedere molto tempo. I metodi sono tuttavia migliorati e sistemi più intelligenti sono ormai la norma. I metodi utilizzati sono ora relativamente statici, con solo un po 'di ricerca destinata a sviluppare metodi completamente nuovi, e la maggior parte della ricerca sta andando a perfezionare le procedure esistenti per renderle sempre più accurate. Il primo software OCR fu utilizzato in una vasta gamma di applicazioni, con le grandi aziende che lo usavano per leggere le impronte delle carte di credito negli anni '50 e il Servizio Postale degli Stati Uniti lo usava per smistare la posta dalla metà degli anni '60.
Dieci anni fa, la scelta di un software OCR era difficile, poiché molti programmi erano piuttosto dannosi per alcuni compiti e ragionevolmente bravi in altri. In questi giorni, tuttavia, il campo è stato ampiamente livellato. I tassi di precisione in qualsiasi buon software OCR per la traduzione di script latini che sono stati digitati sono superiori al 99%. Quando si tratta di inserire la scrittura a mano, tuttavia, o caratteri tipografici più complessi, il software OCR ha ancora una gamma relativamente alta.
Anche il costo del software OCR oscilla ampiamente, spesso in relazione ai tassi di precisione che vanta. È possibile trovare una buona quantità di software OCR gratuito che è adatto per l'immissione di materiale stampato e alcuni possono essere trovati che è relativamente bravo a rilevare la scrittura a mano, specialmente con un po 'di formazione. Le suite di software più costose, come la suite OmniPage, che costa circa $ 100 dollari statunitensi (USD) per la versione domestica e circa $ 450 dollari per la versione professionale, vantano matrici impressionanti di funzionalità e tassi di successo generalmente più elevati.
Sfortunatamente, non esiste ancora un software OCR perfetto, quindi la scelta di un programma da acquistare può essere in gran parte un processo frustrante. Anche i migliori programmi avranno probabilmente un momento difficile con la scrittura a mano e gli errori inevitabilmente si insinueranno, anche a livelli bassi. Principalmente, la scelta di un programma da acquistare si riduce a funzionalità extra: supporto multilingue, integrazione di scansione e conversione con un solo tocco, conversione automatica di PDF e riconoscimento di parole intere in discipline specializzate come campi legali e medici.