¿Qué es la lingüística computacional?
La lingüística computacional es un campo general que abarca muchos aspectos de la psicología, la lingüística, la lógica y la informática. Se trata de ayudar a las computadoras a comprender los problemas lingüísticos para mejorar la automatización de los aspectos de traducción, generación, habla y comprensión.
La lingüística computacional nació después de varios intentos fallidos de traducción automática. A fines de la década de 1940, el gobierno de los EE. UU. Vio la necesidad de una traducción de textos manejada por una máquina, particularmente textos rusos. Se suponía, dada la facilidad con la que las computadoras se habían adaptado para manejar problemas matemáticos, que enseñarles a traducir el lenguaje sería un asunto simple. Sin embargo, rápidamente se hizo evidente que el problema era mucho más difícil y se creó la disciplina de la lingüística computacional.
En los primeros días de la lingüística computacional, el campo estaba dominado por los informáticos. Sin embargo, desde la década de 1970, se ha hecho evidente cuán complejo es realmente el lenguaje, y la lingüística computacional contemporánea utiliza expertos de varios campos.
La traducción automática siempre ha sido un objetivo importante de la lingüística computacional, y uno en el que el campo ha avanzado enormemente. La tarea es muy compleja y requiere la identificación de partes del discurso, una comprensión de la gramática, un vocabulario extenso y mecanismos para tratar los coloquialismos y la jerga. La traducción automática está lejos de ser perfecta, pero con cada año las traducciones se vuelven más precisas y menos forzadas.
El reconocimiento de voz es otra área de la lingüística computacional que ha tenido mucho interés público. Después de algunos intentos fallidos en el software de reconocimiento de voz convencional a mediados de la década de 1990, el campo quedó en silencio por un tiempo. Sin embargo, a principios del siglo XXI, llegaron al mercado una serie de nuevas suites de software de reconocimiento de voz que cuentan con amplios sistemas de aprendizaje y altas tasas de precisión. Esto ha llevado a un interés renovado en el software de reconocimiento de voz por parte del público en general y un aumento en la financiación y la investigación.
La generación del habla es un campo relacionado de la lingüística computacional que ha experimentado un desarrollo constante desde la década de 1980. Alcanzar una lectura natural de un texto escrito es un problema muy difícil, pero que tiene enormes beneficios potenciales. Para los usuarios no videntes, el software de generación de voz puede ser crítico para disfrutar los frutos de la era digital.
La lingüística computacional también juega un papel importante en los sistemas automatizados de corrección gramatical, como los integrados en los procesadores de texto más populares. Un corrector gramatical preciso requiere una capacidad sofisticada para identificar partes del discurso y una lista completa de reglas gramaticales y excepciones. Si bien la mayoría de los correctores de gramática aún tienen muchos problemas, ya se están volviendo indispensables para muchos en la nueva generación.
La lingüística computacional es un campo emocionante que se basa en una amplia gama de disciplinas. Los problemas que tiene que abordar son muchos, y ninguno es simple. Sin embargo, las visiones futuristas que espera hacen que valga la pena la lucha. Desde el sueño de un traductor universal hasta el reconocimiento de voz con palabras perfectas, los objetivos de la lingüística computacional no pueden evitar evocar una sensación de asombro.