¿Qué es OCR (reconocimiento de caracteres ópticos)?

El reconocimiento de caracteres ópticos (OCR) es un proceso de conversión de materiales impresos en archivos de procesamiento de texto o texto que se pueden editar y almacenar fácilmente. La tecnología ha permitido almacenar dichos materiales utilizando mucho menos espacio de almacenamiento que los materiales de copia impresa. La tecnología OCR ha tenido un gran impacto en la forma en que se almacena, comparten y editan la información. Antes del reconocimiento de caracteres ópticos, si alguien quisiera convertir un libro en un archivo de procesamiento de textos, cada página tendría que ser escrita por palabra para palabras.

La tecnología OCR requiere hardware y software. Además, los sistemas OCR sofisticados requieren una placa de circuito adicional en la propia computadora para completar el proceso. Un escáner óptico escanea el texto en una página, luego divide las fuentes en una serie de puntos llamados un mapa de bits. El software puede leer las fuentes más comunes y distinguir dónde comienzan y se detienen las líneas. Este mapa de bits se traduce al texto de la computadora.

mientras que el reconocimiento de caracteres ópticos ha hecho enormeAvances en los últimos años, todavía no siempre funciona bien al reconocer la escritura a mano o las fuentes que se parecen a la escritura a mano. Hay sistemas dentro de la industria bancaria que utilizan la tecnología OCR para tratar de leer las cantidades en cheques escritos a mano, para ir junto con la capacidad de la computadora para leer el enrutamiento y los números de cuenta.

Para dar una idea del poder de OCR, puede ayudar a echar un vistazo a un ejemplo del mundo real. Imagine un departamento de policía que tiene todos sus antecedentes penales almacenados en grandes archivadores. Aunque escanear millones de páginas sería una tarea costosa y que requiere mucho tiempo, los beneficios son enormes.

Una vez que el sistema OCR ha convertido las páginas en texto legible por computadora, un detective, por ejemplo, podría buscar a través de todo el historial en unos pocos segundos. Encontrar manualmente un registro en particular podría no ser demasiado difícil, pero imagine a un detective que intenta amontonarseCH para todos los crímenes cometidos en una determinada intersección entre las 8:00 y las 8:30. Este ejemplo solo rasca la superficie del poder del texto de búsqueda, y es solo una razón por la cual muchas empresas e instituciones están gastando millones de dólares para OCR sus datos heredados.

¿Qué es OCR (reconocimiento de caracteres ópticos)?

OTROS IDIOMAS