Hvad er kontrolleret ordforråd?
Kontrolleret ordforråd er et koncept inden for datalogi og computerprogrammering, der involverer kun brug af tidligere aftalte eller godkendte termer, når man konstruerer relationelle databaser, søgbare metadata eller andre systemer, hvori mennesker kan læses ord bruges til at markere information til senere hentning. Metodikken til at bruge et kontrolleret ordforråd til at klassificere information står i direkte kontrast til begrebet naturligt sprogligt ordforråd, hvor der ikke er nogen aftalte vilkår, og alle ord, der bruges, er i stedet forbundet med vægtede relationer. Ud over de øverste ord, der bruges i et kontrolleret ordforråd, kan understøttende ord bruges, så synonymer eller andre udtryk, der er stærkt forbundet med det øverste niveau, kan udløse brugen af det øverste niveau. De vigtigste forskelle, der måles mellem naturlige sprogsystemer og kontrollerede ordforrådssystemer, er relevansen af resultaterne af en forespørgsel ved hjælp af ordene, mængden af returneret information og den generelle anvendelighed af systemet.
Der er mange tilfælde, hvor en samling af ord eller termer bruges til at gøre oplysninger, der er vilkårlige, konstant ændrede eller uorganiserede mere tilgængelige for brugerne. Søgeudtryk inden for en internetsøgemaskine, en virksomhedsinformationsdatabase og endda et digitalt forskningsbibliotek er alle eksempler på applikationer, gennem hvilke information kan kategoriseres med metadataterms i modsætning til en streng hierarkisk struktur. De ord, der bruges til at beskrive et objekt i sådanne situationer, bygger et slags søgbart indeks for den større informationspulje.
Et eksempel på brugen af kontrolleret ordforråd kan ses, når man overvejer et arkiveringssystem til en virksomhed. Filer skal kategoriseres på en måde, så de let og forudsigeligt kan hentes. Hvis en fil omhandler biler, kan den arkiveres under kategorien "biler". Hvis en anden person også har en fil, der omhandler biler uden et kontrolleret ordforråd, kan filen muligvis placeres under overskriften "biler", hvilket gør de to filer vanskelige at finde med en enkelt søgning. Når kategorierne kontrolleres, vil alle filer, der beskæftiger sig med biler, blive placeret under en samlet aftalt overskrift.
Fordelen ved at bruge et kontrolleret ordforråd er, at information er strengt beskrevet på en forudsigelig måde. Dette betyder, at enhver, der er opmærksom på ordforrådet, effektivt og nøjagtigt kan søge efter information. En komplikation med ordforrådet er imidlertid, at søgetermerne er vanskeligere, hvis ikke umulige, at generere automatisk og normalt kræver noget menneskeligt indgreb, hvilket gør det til en stor opgave at konvertere eksisterende databaser til at bruge et kontrolleret ordforråd. Hvis ordforrådet ikke er stort nok, er der også muligheden for, at en enkelt forespørgsel frembringer et så stort informationsvolumen, at det bliver upraktisk at sortere uden brug af en anden forespørgselsmetode.