O que é Desambiguação do Sentido da Palavra?
A desambiguação de sentido de palavra (WSD) está no centro dos programas de software projetados para interpretar a linguagem. Palavras ou frases ambíguas podem ser entendidas de várias maneiras, embora apenas um significado seja pretendido. A ambiguidade procura decifrar o significado pretendido das palavras e frases. Essa área é extremamente desafiadora para os programadores encarregados de projetar interfaces precisas para preencher a lacuna entre a linguagem falada e escrita e as traduções geradas por computador.
O software projetado para converter voz em texto pode "ouvir" um usuário falando em um microfone e traduzir palavras faladas em frases digitadas. O usuário determina pontuação, incluindo palavras como "vírgula" e "ponto final", quando apropriado. Isso parece bastante direto, exceto que muitas palavras soam exatamente iguais.
Por exemplo, saber e não ou eu e olho são foneticamente indistinguíveis. A desambiguação no sentido das palavras ajuda a traduzir “eu deveria saber até a próxima semana”, corretamente, usando o que é basicamente um conjunto de regras “se, então” que levam em consideração o posicionamento das palavras e as palavras adjacentes como indicadores da palavra pretendida. Esse tipo de desambiguação do sentido da palavra é conhecido como "abordagem superficial" e é bastante preciso, mas nem sempre pode ser contado.
Outra abordagem é aplicar o "conhecimento do mundo" ou o que a linguística de computador chama de "abordagem profunda". Essa abordagem baseia-se em léxicos como dicionários e tesauros para ajudar a determinar o sentido adequado de uma palavra. Infelizmente, projetar um banco de dados de abordagem profunda que seja abrangente o suficiente para fornecer melhor precisão do que a abordagem superficial não é uma tarefa fácil.
O software que lê texto em voz alta (conversão de texto em fala) também requer desambiguação no sentido da palavra. A palavra baixo , por exemplo, pode significar um instrumento musical, uma nota ou um peixe. No último caso, é pronunciado de maneira diferente, deixando para o WSD deduzir qual pronúncia usar. Se a frase digitada for "O baixo é pesado", apenas uma varredura das frases ao redor poderá revelar pistas, como encontrar as palavras "pescar", "barco", "barco", "atracar" ou, inversamente, "banda", " música ”ou“ música ”. Se a desambiguação do sentido das palavras do programa não for suficientemente robusta ou se houver pistas adicionais ausentes, o programa poderá cometer erros na tradução.
Além das regras "se, então" da abordagem superficial, algoritmos também são usados para determinar interpretações corretas. No exemplo acima, um algoritmo pode encontrar palavras-chave em todo o documento que apontem claramente para uma interpretação musical ou vice-versa. Outras abordagens também são usadas no WSD que são basicamente refinamentos ou extensões dessas abordagens básicas.
A desambiguação no sentido das palavras também é vital nas interfaces de comando verbal projetadas para substituir o teclado - não apenas na retransmissão de comandos simples do sistema operacional, mas em tarefas complexas, como pesquisar na Web. Outras áreas em que o WSD desempenha um papel incluem o desenvolvimento da Web Semântica e modelos aprimorados de inteligência artificial. De fato, qualquer área da ciência que se baseie em uma ponte lingüística entre humano e máquina usará a desambiguação do sentido da palavra.