Skip to main content

O que é o processamento de linguagem natural?

O processamento de linguagem natural (PNL) é uma maneira de traduzir entre idiomas de computador e idiomas humanos. O objetivo desse campo é permitir que os computadores entendam o que um texto diz sem receber valores e equações precisos para os dados que o texto contém. Em essência, o processamento de linguagem natural automatiza o processo de tradução entre idiomas humano e computador. Embora grande parte desse campo dependa de estatísticas e modelos para determinar os prováveis ​​significados de uma frase, existem e existem muitas abordagens diferentes para esse problema. As descobertas neste campo têm aplicações nas áreas de reconhecimento de fala, tradução de linguagem humana, recuperação de informações e até inteligência artificial.

Evoluindo de um background em ciência da computação e linguística, o processamento da linguagem natural enfrenta muitos problemas porque a linguagem nem sempre é consistente e nem todas as pistas para o significado estão contidas na própria linguagem. Mesmo uma descrição completa de toda a gramática de um idioma, incluindo todas as exceções, nem sempre permite que um computador analise as informações contidas em um texto. Algumas sentenças são sintaticamente ambíguas, as palavras geralmente têm mais de um significado e algumas combinações de sons ou símbolos mudam de significado dependendo dos limites das palavras - todas elas podem ser problemas para um computador que não entende o contexto. Mais importante, grande parte da linguagem depende de uma conexão com o universo físico e social - algumas frases, como atos de fala, não transmitem informações tanto quanto agem no mundo. Mesmo que um computador tenha um entendimento perfeito da sintaxe e da semântica da linguagem humana, o texto a ser analisado deve estar livre de dispositivos humanos, como sarcasmo ou agressão passiva, para que o computador verifique corretamente o que o texto significa.

Em termos ideológicos, o processamento de linguagem natural é um sistema de interação homem-computador que é governado pela ideia de que a maioria dos usuários de computadores se sente mais à vontade trabalhando com computadores em uma linguagem humana que eles já conhecem do que em se adaptar à linguagem de um computador. Também capitaliza o fato de que grande parte do conhecimento humano já está codificado na linguagem humana, e os textos que contêm esse conhecimento podem ser traduzidos em estruturas lógicas que podem ser otimizadas para um computador. Embora muitos projetos neste campo trabalhem para extrair dados legíveis por computador de textos em linguagem humana, o processamento de linguagem natural também é usado para gerar textos legíveis por humanos a partir de dados de computador. Esses recursos de compreensão e geração podem ser usados ​​pela mesma tecnologia, como no caso de aplicativos que traduzem de uma linguagem humana para outra, decodificando primeiro o texto em uma linguagem de computador e, em seguida, codificando-o em outra linguagem humana. As inovações obtidas nos esforços de processamento de linguagem natural também são notavelmente aplicáveis ​​a projetos de inteligência artificial, devido ao grau em que a inteligência semelhante à humana é definida pelo domínio das complexidades da linguagem humana.