Hva er kontrollert vokabular?
Kontrollert ordforråd er et begrep innen informatikk og dataprogrammering som innebærer å bruke kun tidligere avtalt eller godkjente vilkår når man bygger relasjonsdatabaser, søkbare metadata eller andre systemer der menneskelig lesbare ord brukes til å markere informasjon for senere henting. Metodikken for å bruke et kontrollert ordforråd for å klassifisere informasjon står i direkte kontrast til begrepet naturlige språklige ordforråder, der det ikke er noen avtalte begreper, og alle ord som brukes er i stedet forbundet med vektede relasjoner. I tillegg til de øverste ordene som brukes i et kontrollert ordforråd, kan støtteord brukes slik at synonymer eller andre termer som er sterkt assosiert med det øverste nivået kan utløse bruk av det øverste ordet. Hovedforskjellene som måles mellom naturlige språksystemer og kontrollerte ordforrådssystemer er relevansen av resultatene av en spørring ved hjelp av ordene, volumet av informasjon som returneres og systemets generelle brukbarhet.
Det er mange tilfeller der en samling av ord eller termer brukes til å gjøre informasjon som er vilkårlig, kontinuerlig endret eller uorganisert mer tilgjengelig for brukere. Søkeord i en Internett-søkemotor, en bedriftsinformasjonsdatabase og til og med et digitalt forskningsbibliotek er alle eksempler på applikasjoner som informasjon kan kategoriseres med metadataterm på i motsetning til en streng hierarkisk struktur. Ordene som brukes for å beskrive et objekt i slike situasjoner bygger en slags søkbar indeks for den større informasjonspuljen.
Et eksempel på bruk av kontrollert ordforråd kan sees når man vurderer et arkiveringssystem for et selskap. Filer må kategoriseres på en måte slik at de enkelt og forutsigbart kan hentes. Hvis en fil omhandler biler, kan den legges inn under kategorien "biler". Skulle en annen person også ha en fil som omhandler biler, uten kontrollert ordforråd, kan filen plasseres under overskriften "biler", noe som gjør de to filene vanskelige å finne med et enkelt søk. Når kategoriene kontrolleres, vil alle filer som omhandler biler bli plassert under en avtalt overskrift.
Fordelen med å bruke et kontrollert ordforråd er at informasjon er strengt beskrevet på en forutsigbar måte. Dette betyr at alle som er klar over ordforrådet, effektivt og nøyaktig kan søke etter informasjon. En komplikasjon med ordforrådet er imidlertid at søkeordene er vanskeligere, om ikke umulige, å generere automatisk og vanligvis krever noe menneskelig intervensjon, noe som gjør det til en stor oppgave å konvertere eksisterende databaser for å bruke et kontrollert ordforråd. Hvis ordforrådet ikke er stort nok, er det også muligheten for at en enkelt spørring får frem et så stort informasjonsvolum at det blir upraktisk å sortere uten bruk av en annen spørringsmetode.