Qu'est-ce que le vocabulaire contrôlé?
Le vocabulaire contrôlé est un concept en informatique et en programmation informatique qui implique l’utilisation de termes uniquement convenus ou approuvés lors de la construction de bases de données relationnelles, de métadonnées interrogeables ou d’autres systèmes dans lesquels des mots lisibles par l’homme sont utilisés pour marquer les informations en vue de leur extraction ultérieure. La méthodologie consistant à utiliser un vocabulaire contrôlé pour classer les informations contraste directement avec le concept de vocabulaire en langage naturel, dans lequel il n’existe pas de termes convenus et où tous les mots utilisés sont reliés par des relations pondérées. En plus des mots de niveau supérieur utilisés dans un vocabulaire contrôlé, vous pouvez également utiliser des mots auxiliaires pour que les synonymes ou autres termes étroitement associés au terme de niveau supérieur puissent déclencher l'utilisation du mot de niveau supérieur. Les principales différences mesurées entre les systèmes en langage naturel et les systèmes à vocabulaire contrôlé sont la pertinence des résultats d'une requête utilisant les mots, le volume d'informations renvoyé et la facilité d'utilisation globale du système.
Il existe de nombreux cas dans lesquels une collection de mots ou de termes est utilisée pour rendre les informations arbitraires, en constante évolution ou désorganisées plus accessibles aux utilisateurs. Les termes de recherche dans un moteur de recherche Internet, une base de données d’entreprise, et même une bibliothèque de recherche numérique sont des exemples d’applications permettant de catégoriser l’information avec des termes de métadonnées plutôt qu’une structure hiérarchique stricte. Les mots utilisés pour décrire un objet dans de telles situations constituent une sorte d'index interrogeable du plus grand pool d'informations.
Un exemple d'utilisation d'un vocabulaire contrôlé peut être vu lors de l'examen d'un système de classement pour une entreprise. Les fichiers doivent être classés de manière à pouvoir être récupérés facilement et de manière prévisible. Si un fichier concerne des voitures, il pourrait être classé dans la catégorie "voitures". Si une autre personne dispose également d’un fichier traitant des voitures, sans vocabulaire contrôlé, il peut être placé dans la rubrique "automobiles", ce qui rend les deux fichiers difficiles à trouver en une seule recherche. Lorsque les catégories sont contrôlées, tous les fichiers concernant les voitures sont placés sous un seul en-tête convenu.
L'avantage d'utiliser un vocabulaire contrôlé réside dans le fait que l'information est strictement décrite de manière prévisible. Cela signifie que toute personne connaissant le vocabulaire sera capable de rechercher efficacement et avec précision des informations. Une complication avec le vocabulaire, cependant, est que les termes de recherche sont plus difficiles, voire impossibles, à générer automatiquement et nécessitent généralement une intervention humaine, ce qui rend très complexe la conversion des bases de données existantes en un vocabulaire contrôlé. Si le vocabulaire n'est pas assez important, il est également possible qu'une seule requête génère un volume d'informations si important qu'il devient impossible de trier sans utiliser une autre méthode d'interrogation.