O que é Linguística Computacional?
A lingüística computacional é um campo geral que engloba muitos aspectos da psicologia, linguística, lógica e ciência da computação. Ele se preocupa em ajudar os computadores a entender questões linguísticas, a fim de melhorar a automação de aspectos de tradução, geração, fala e compreensão.
A linguística computacional nasceu após várias tentativas fracassadas de tradução automática. No final da década de 1940, o governo dos EUA viu a necessidade de tradução de textos manipulada à máquina, principalmente textos russos. Supunha-se, dada a facilidade com que os computadores haviam sido adaptados para lidar com problemas matemáticos, que ensiná-los a traduzir a linguagem seria um assunto simples. Logo ficou claro que o problema era muito mais difícil, e a disciplina da linguística computacional foi criada.
Nos primeiros dias da lingüística computacional, o campo era dominado por cientistas da computação. Desde a década de 1970, no entanto, tornou-se evidente como a linguagem é realmente complexa, e a lingüística computacional contemporânea faz uso de especialistas de vários campos.
A tradução automática sempre foi um dos principais objetivos da lingüística computacional, e um no qual o campo fez avanços enormes. A tarefa é muito complexa, exigindo a identificação de partes do discurso, a compreensão da gramática, um vocabulário extenso e mecanismos para lidar com coloquialismos e gírias. A tradução automática está longe de ser perfeita, mas a cada ano as traduções se tornam mais precisas e menos forçadas.
O reconhecimento de fala é outra área da lingüística computacional que tem visto muito interesse público. Após algumas tentativas abortadas de software de reconhecimento de fala convencional, em meados dos anos 90, o campo ficou em silêncio por um tempo. No início do século XXI, no entanto, vários novos softwares de reconhecimento de fala chegaram ao mercado com sistemas de aprendizado extensos e altas taxas de precisão. Isso levou a um interesse renovado no software de reconhecimento de fala pelo público em geral e a um aumento conjunto de financiamento e pesquisa.
A geração de fala é um campo relacionado da lingüística computacional que tem apresentado desenvolvimento constante desde os anos 80. Atingir uma leitura natural do texto escrito é um problema muito difícil, mas que traz enormes benefícios potenciais. Para usuários sem visão, o software de geração de fala pode ser fundamental para desfrutar dos frutos da era digital.
A linguística computacional também desempenha um papel importante nos sistemas automatizados de correção gramatical, como os integrados nos processadores de texto mais populares. Um verificador gramatical preciso exige uma capacidade sofisticada de identificar partes do discurso e uma lista abrangente de regras e exceções gramaticais. Embora a maioria dos verificadores gramaticais comuns ainda tenha muitos problemas, eles já estão se tornando indispensáveis para muitos da nova geração.
A linguística computacional é um empolgante desenho de campo de uma ampla variedade de disciplinas. Os problemas que ele precisa resolver são muitos e nenhum é simples. As visões futuristas que espera, no entanto, fazem valer a pena uma luta. Do sonho de um tradutor universal ao reconhecimento de fala com palavras perfeitas, os objetivos da lingüística computacional não podem deixar de evocar um sentimento de admiração.