Wat is gecontroleerd vocabulaire?

Gecontroleerde vocabulaire is een concept in informatica en computerprogrammering waarbij alleen eerder overeengekomen of goedgekeurde termen worden gebruikt bij het construeren van relationele databases, doorzoekbare metagegevens of andere systemen waarin door mensen leesbare woorden worden gebruikt om informatie te markeren voor later ophalen. De methode voor het gebruik van een gecontroleerde vocabulaire om informatie te classificeren, staat in contrast met het concept van natuurlijke taalvocabulaire, waarin er geen overeengekomen termen zijn en alle gebruikte woorden worden in plaats daarvan verbonden door gewogen relaties. Naast de woorden op het hoogste niveau die worden gebruikt in een gecontroleerde vocabulaire, kunnen ondersteunende woorden worden gebruikt zodat synoniemen of andere termen die sterk worden geassocieerd met de term op het hoogste niveau, het gebruik van het woord op het hoogste niveau kan activeren. De belangrijkste verschillen die worden gemeten tussen natuurlijke taalsystemen en gecontroleerde vocabulaire systemen zijn de relevantie van de resultaten van een query met behulp van de woorden, het geretourneerde informatievolume en de OVEBruikbaarheid van het systeem rall.

Er zijn veel gevallen waarin een verzameling woorden of termen wordt gebruikt om informatie te maken die willekeurig is, voortdurend veranderend of ongeorganiseerd is voor gebruikers. Zoektermen binnen een internetzoekmachine, een bedrijfsinformatiedatabase en zelfs een digitale onderzoeksbibliotheek zijn allemaal voorbeelden van applicaties waardoor informatie kan worden gecategoriseerd met metadata -termen in tegenstelling tot een strikte hiërarchische structuur. De woorden die worden gebruikt om een ​​object in dergelijke situaties te beschrijven bouwen een soort doorzoekbare index van de grotere pool van informatie.

Een voorbeeld van het gebruik van gecontroleerde woordenschat is te zien bij het overwegen van een archiefsysteem voor een bedrijf. Bestanden moeten op een bepaalde manier worden gecategoriseerd, zodat ze gemakkelijk en voorspelbaar zijn. Als een bestand met auto's behandelt, kan het worden ingediend onder de categorie "auto's". Mocht een andere persoon ook een bestand hebbenDat behandelt auto's, zonder een gecontroleerde vocabulaire, kan het bestand onder de kop "auto's" worden geplaatst, waardoor de twee bestanden moeilijk te vinden zijn met een enkele zoekopdracht. Wanneer de categorieën worden bestuurd, zouden alle bestanden die met auto's te maken hebben, worden geplaatst onder een enkele overeengekomen kop.

Het voordeel van het gebruik van een gecontroleerde vocabulaire is dat informatie strikt op een voorspelbare manier wordt beschreven. Dit betekent dat iedereen die op de hoogte is van de woordenschat in staat zal zijn om effectief en nauwkeurig naar informatie te zoeken. Een complicatie met de woordenschat is echter dat de zoektermen moeilijker, zo niet onmogelijk zijn om automatisch te genereren en meestal wat menselijke tussenkomst vereisen, waardoor het een grote taak is om bestaande databases om te zetten om een ​​gecontroleerde woordenschat te gebruiken. Als de woordenschat niet groot genoeg is, dan is er ook de mogelijkheid dat een enkele vraag zo groot is dat een groot aantal informatie naar voren komt dat het onpraktisch wordt om te sorteren zonder het gebruik van een andere Querying -methode.

ANDERE TALEN