Qu'est-ce que l'OCR (reconnaissance des caractères optiques)?

La reconnaissance des caractères optiques (OCR) est un processus de conversion de matériaux imprimés en fichiers de texte ou de traitement de texte qui peuvent être facilement modifiés et stockés. La technologie a permis de stocker ces matériaux en utilisant beaucoup moins d'espace de stockage que les matériaux de copie papier. La technologie OCR a eu un impact énorme sur la façon dont les informations sont stockées, partagées et éditées. Avant la reconnaissance optique des caractères, si quelqu'un voulait transformer un livre en fichier de traitement de texte, chaque page devrait être dactylographiée pour mot.

La technologie OCR nécessite à la fois du matériel et des logiciels. De plus, les systèmes OCR sophistiqués nécessitent une carte de circuit imprimé supplémentaire dans l'ordinateur lui-même pour terminer le processus. Un scanner optique scanne le texte sur une page, puis décompose les polices en une série de points appelés bitmap. Le logiciel peut lire les polices les plus courantes et distinguer où les lignes commencent et s'arrêtent. Ce bitmap est ensuite traduit en texte de l'ordinateur.

tandis que la reconnaissance optique des caractères a rendu énormeLes progrès des dernières années, il ne fonctionne toujours pas toujours dans la reconnaissance de l'écriture ou des polices qui ressemblent à l'écriture. Il existe des systèmes dans le secteur bancaire qui utilisent la technologie OCR pour essayer de lire les montants sur des chèques manuscrits, pour accompagner la capacité de l'ordinateur à lire les numéros de routage et de compte.

Pour donner une idée de la puissance de l'OCR, cela peut aider à jeter un œil à un exemple réel. Imaginez un service de police qui a tous ses casiers judiciaires stockés dans de vastes classeurs. Bien que la numérisation des millions de pages serait une entreprise coûteuse et longue, les avantages sont énormes.

Une fois que le système OCR a converti les pages en texte lisible par ordinateur, un détective, par exemple, pourrait rechercher dans toute l'historique en quelques secondes. Trouver manuellement un dossier particulier n'est peut-être pas trop difficile, mais imaginez un détective essayant de saisirCH pour tous les crimes commis sur une certaine intersection entre 8h00 et 8h30. Cet exemple ne fait que gratter la surface de la puissance du texte consultable, et ce n'est qu'une des raisons pour lesquelles de nombreuses entreprises et institutions dépensent des millions de dollars pour OCR leurs données héritées.

DANS D'AUTRES LANGUES