O que é o vocabulário controlado?
Vocabulário controlado é um conceito em ciência da computação e programação de computadores que envolve o uso de termos previamente acordados ou aprovados na construção de bancos de dados relacionais, metadados pesquisáveis ou outros sistemas nos quais palavras legíveis por humanos são usadas para marcar informações para recuperação posterior. A metodologia de uso de um vocabulário controlado para classificar as informações contrasta diretamente com o conceito de vocabulário da linguagem natural, no qual não há termos acordados e todas as palavras usadas são conectadas por relações ponderadas. Além das palavras de nível superior usadas em um vocabulário controlado, as palavras de suporte podem ser usadas para que sinônimos ou outros termos fortemente associados ao termo de nível superior possam acionar o uso da palavra de nível superior. As principais diferenças medidas entre os sistemas de linguagem natural e os sistemas de vocabulário controlado são a relevância dos resultados de uma consulta usando as palavras, o volume de informações retornadas e a usabilidade geral do sistema.
Existem muitos casos em que uma coleção de palavras ou termos é usada para tornar as informações arbitrárias, constantemente alteradas ou desorganizadas mais acessíveis aos usuários. Os termos de pesquisa em um mecanismo de pesquisa na Internet, um banco de dados corporativo de informações e até mesmo uma biblioteca de pesquisa digital são exemplos de aplicativos através dos quais as informações podem ser categorizadas com termos de metadados, em oposição a uma estrutura hierárquica rigorosa. As palavras usadas para descrever um objeto nessas situações criam um tipo de índice pesquisável do conjunto maior de informações.
Um exemplo do uso de vocabulário controlado pode ser visto ao considerar um sistema de arquivamento para uma empresa. Os arquivos devem ser categorizados de forma a serem recuperados com facilidade e previsibilidade. Se um arquivo lida com carros, ele pode ser arquivado na categoria "carros". Caso outra pessoa também tenha um arquivo que lida com carros, sem um vocabulário controlado, o arquivo pode ser colocado sob o título "automóveis", dificultando a localização dos dois arquivos com uma única pesquisa. Quando as categorias são controladas, todos os arquivos relacionados aos carros são colocados em um único cabeçalho acordado.
O benefício de usar um vocabulário controlado é que as informações são estritamente descritas de maneira previsível. Isso significa que qualquer pessoa que esteja ciente do vocabulário poderá pesquisar informações de maneira eficaz e precisa. Uma complicação com o vocabulário, no entanto, é que os termos de pesquisa são mais difíceis, se não impossíveis, de gerar automaticamente e geralmente requerem alguma intervenção humana, tornando uma grande tarefa converter os bancos de dados existentes para usar um vocabulário controlado. Se o vocabulário não for grande o suficiente, também há a possibilidade de uma única consulta exibir um volume tão grande de informações que se torna impraticável classificar sem o uso de outro método de consulta.