Was ist kontrollierter Wortschatz?
Kontrolliertes Vokabular ist ein Konzept in der Informatik und in der Computerprogrammierung, bei dem nur zuvor vereinbarte oder genehmigte Begriffe beim Aufbau relationaler Datenbanken, durchsuchbarer Metadaten oder anderer Systeme verwendet werden, in denen für den späteren Abruf lesbare Wörter zum Markieren von Informationen verwendet werden. Die Methode der Verwendung eines kontrollierten Vokabulars zur Klassifizierung von Informationen steht im direkten Gegensatz zum Konzept des natürlichen Sprachvokabulars, bei dem keine vereinbarten Begriffe vorhanden sind und alle verwendeten Wörter durch gewichtete Beziehungen verbunden sind. Zusätzlich zu den Wörtern der obersten Ebene, die in einem kontrollierten Vokabular verwendet werden, können unterstützende Wörter verwendet werden, sodass Synonyme oder andere Begriffe, die stark mit dem Begriff der obersten Ebene verknüpft sind, die Verwendung des Wortes der obersten Ebene auslösen können. Die Hauptunterschiede, die zwischen natürlichen Sprachsystemen und kontrollierten Vokabelsystemen gemessen werden, sind die Relevanz der Ergebnisse einer Abfrage anhand der Wörter, das zurückgegebene Informationsvolumen und die allgemeine Verwendbarkeit des Systems.
Es gibt viele Fälle, in denen eine Sammlung von Wörtern oder Begriffen verwendet wird, um Informationen, die willkürlich sind, sich ständig ändern oder unorganisiert sind, für Benutzer zugänglicher zu machen. Suchbegriffe in einer Internet-Suchmaschine, eine Unternehmensinformationsdatenbank und sogar eine digitale Forschungsbibliothek sind Beispiele für Anwendungen, mit denen Informationen anstelle einer strengen hierarchischen Struktur mit Metadaten-Begriffen kategorisiert werden können. Die Wörter, die zur Beschreibung eines Objekts in solchen Situationen verwendet werden, bilden eine Art durchsuchbaren Index des größeren Informationspools.
Ein Beispiel für die Verwendung von kontrolliertem Vokabular ist die Betrachtung eines Ablagesystems für ein Unternehmen. Dateien müssen so kategorisiert werden, dass sie leicht und vorhersehbar abgerufen werden können. Wenn sich eine Datei mit Autos befasst, könnte sie unter der Kategorie "Autos" abgelegt werden. Sollte eine andere Person auch eine Datei haben, die sich mit Autos ohne kontrolliertes Vokabular befasst, könnte die Datei unter der Überschrift "Automobile" platziert werden, was es schwierig macht, die beiden Dateien mit einer einzigen Suche zu finden. Wenn die Kategorien kontrolliert werden, werden alle Dateien, die sich mit Autos befassen, unter eine einzige vereinbarte Überschrift gestellt.
Der Vorteil der Verwendung eines kontrollierten Vokabulars besteht darin, dass Informationen streng vorhersehbar beschrieben werden. Dies bedeutet, dass jeder, der das Vokabular kennt, effektiv und genau nach Informationen suchen kann. Eine Komplikation des Vokabulars besteht jedoch darin, dass es schwieriger, wenn nicht unmöglich ist, die Suchbegriffe automatisch zu generieren, und in der Regel einige Eingriffe von Menschen erforderlich sind. Dies macht es zu einer großen Aufgabe, vorhandene Datenbanken für die Verwendung eines kontrollierten Vokabulars zu konvertieren. Wenn das Vokabular nicht groß genug ist, besteht auch die Möglichkeit, dass eine einzelne Abfrage eine so große Menge an Informationen enthält, dass das Sortieren ohne die Verwendung einer anderen Abfragemethode nicht praktikabel ist.